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Avant-propos 


Quelques mots sur l’origine de ce cours 


Ce cours a été conçu à l’origine pour les étudiants débutants en programmation Python des filières de biologie et de 
biochimie de l’université Paris Diderot - Paris 7 |; et plus spécialement pour les étudiants du master Biologie Informatique. 

Ce cours est basé sur la version 3 de Python, version recommandée par la communauté scientifique. Des références à 
l’ancienne version, Python 2, seront néanmoins régulièrement apportées. 

Si vous relevez des erreurs à la lecture de ce document, merci de nous les signaler. 

Le cours est disponible en version HTML ? et PDF *. 
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Chapitre 1 


Introduction 


1.1 C’est quoi Python? 


Le langage de programmation Python a été créé en 1989 par Guido van Rossum, aux Pays-Bas. Le nom Pyfhon vient d’un 
hommage à la série télévisée Monty Python’s Flying Circus dont G. van Rossum est fan. La première version publique de ce 
langage a été publiée en 1991. 

La dernière version de Python est la version 3. Plus précisément, la version 3.7 a été publiée en juin 2018. La version 2 
de Python est désormais obsolète et cessera d’être maintenue après le ler janvier 2020. Dans la mesure du possible évitez de 
l'utiliser. 

La Python Software Foundation ' est V association qui organise le développement de Python et anime la communauté de 
développeurs et d’utilisateurs. 

Ce langage de programmation présente de nombreuses caractéristiques intéressantes : 

— Il est multiplateforme. C’est-a-dire qu’il fonctionne sur de nombreux systèmes d’ exploitation : Windows, Mac OS X, 

Linux, Android, iOS, depuis les mini-ordinateurs Raspberry Pi jusqu’aux supercalculateurs. 

— Il est gratuit. Vous pouvez l'installer sur autant d’ordinateurs que vous voulez (même sur votre téléphone !). 

— C’est un langage de haut niveau. Il demande relativement peu de connaissance sur le fonctionnement d’un ordinateur 

pour être utilisé. 

— C’est un langage interprété. Un script Python n’a pas besoin d’être compilé pour être exécuté, contrairement à des 

langages comme le C ou le C++. 

— Il est orienté objet. C’est-à-dire qu'il est possible de concevoir en Python des entités qui miment celles du monde réel 

(une cellule, une protéine, un atome, etc.) avec un certain nombre de règles de fonctionnement et d’interactions. 

— Il est relativement simple à prendre en main ?. 

— Enfin, il est très utilisé en bioinformatique et plus généralement en analyse de données. 

Toutes ces caractéristiques font que Python est désormais enseigné dans de nombreuses formations, depuis l’enseignement 
secondaire jusqu’à l’enseignement supérieur. 


1.2 Conseils pour installer et configurer Python 


Pour apprendre la programmation Python, il va falloir que vous pratiquiez et pour cela il est préférable que Python soit 
installé sur votre ordinateur. La bonne nouvelle est que vous pouvez installer gratuitement Python sur votre machine, que 
ce soit sous Windows, Mac OS X ou Linux. Nous donnons dans cette rubrique un résumé des points importants concer- 


nant cette installation. Tous les détails et la marche à suivre pas à pas sont donnés à l’adresse https://python.sdv. 
univ-paris-diderot.fr/livre-dunod. 


1.2.1 Python 2 ou Python 3? 


Ce cours est basé sur la version 3 de Python, qui est désormais le standard. 


1. https: //www.python.org/pst/ 
2. Nous sommes d'accord, cette notion est très relative. 
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Si, néanmoins, vous deviez un jour travailler sur un ancien programme écrit en Python 2, sachez qu'il existe quelques 
différences importantes entre Python 2 et Python 3. Le chapitre 21 Remarques complémentaires vous apportera plus de préci- 
sions. 


1.2.2 Miniconda 


Nous vous conseillons d'installer Miniconda *, logiciel gratuit, disponible pour Windows, Mac OS X et Linux, et qui 
installera pour vous Python 3. 

Avec le gestionnaire de paquets conda, fourni avec Miniconda, vous pourrez installer des modules supplémentaires qui 
sont très utiles en bioinformatique (NumPy, scipy, matplotlib, pandas, Biopython), mais également les notebooks Jupyter. 
Vous trouverez en ligne * une documentation pas à pas pour installer Miniconda, Python 3 et les modules supplémentaires qui 
seront utilisés dans ce cours. 


1.2.3 Editeur de texte 


L'apprentissage d’un langage informatique comme Python va nécessiter d’ écrire des lignes de codes à l’aide d’un éditeur 
de texte. Si vous étes débutants, on vous conseille d’utiliser notepad++ sous Windows, BBEdit ou CotEditor sous Mac OS X 
et gedit sous Linux. La configuration de ces éditeurs de texte est détaillée dans la rubrique Installation de Python disponible 
en ligne 5. Bien sûr, si vous préférez d’autres éditeurs comme Atom, Visual Studio Code, Sublime Text, emacs, vim, geany... 
utilisez-les ! 

A toute fin utile, on rappelle que les logiciels Microsoft Word, WordPad et LibreOffice Writer ne sont pas des éditeurs de 
texte, ce sont des traitements de texte qui ne peuvent pas et ne doivent pas étre utilisés pour écrire du code informatique. 


1.3 Notations utilisées 


Dans cet ouvrage, les commandes, les instructions Python, les résultats et les contenus de fichiers sont indiqués avec cette 
police pour les éléments ponctuels ou 


sous cette forme, 
sur plusieurs lignes, 
pour les éléments les plus longs. 


Pour ces derniers, le numéro a gauche indique le numéro de la ligne et sera utilisé pour faire référence a une instruction 
particulière. Ce numéro n’est bien sûr là qu’à titre indicatif. 

Par ailleurs, dans le cas de programmes, de contenus de fichiers ou de résultats trop longs pour être inclus dans leur 
intégralité, la notation [...] indique une coupure arbitraire de plusieurs caractères ou lignes. 


1.4 Introduction au shell 


Un shell est un interpréteur de commandes interactif permettant d’interagir avec l’ordinateur. On utilisera le shell pour 
lancer l’interpréteur Python. 

Pour approfondir la notion de shell, vous pouvez consulter les pages Wikipedia : 

— du shell Unix © fonctionnant sous Mac OS X et Linux; 

— du shell PowerShell” fonctionnant sous Windows. 

Un shell possède toujours une invite de commande, c’est-à-dire un message qui s’affiche avant l’endroit où on entre des 
commandes. Dans tout cet ouvrage, cette invite est représentée systématiquement par le symbole dollar $, et ce quel que soit 
le système d’ exploitation. 

Par exemple, si on vous demande de lancer I’ instruction suivante : 

$ python 

il faudra taper seulement python sans le $ ni l’espace après le $. 


W 


https://conda.io/miniconda.html 
https://python.sdv.univ-paris-diderot.fr/livre-dunod 
https://python.sdv.univ-paris-diderot.fr/livre-dunod 
. https://fr.wikipedia.org/wiki/Shell Unix 

. https://fr.wikipedia.org/wiki/Windows_PowerShell 


joues 
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1.5 Premier contact avec Python 


Python est un langage interprété, c’est-à-dire que chaque ligne de code est lue puis interprétée afin d’être exécutée par 
l’ordinateur. Pour vous en rendre compte, ouvrez un shell puis lancez la commande : 

python 

La commande précédente va lancer l’interpréteur Python. Vous devriez obtenir quelque chose de ce style pour Windows : 


PS C:\Users\pierre> python 
Python 3.7.1 (default, Dec 10 2018, 22:54:23) [MSC v.1915 64 bit (AMD64)] [...] 


Type "help", "copyright", "credits" or "license" for more information. 
>>> 
pour Mac OS X : 


iMac-de-pierre:Downloads$ python 
Python 3.7.1 (default, Dec 14 2018, 19:28:38) 


[Clang 4.0.1 (tags/RELEASE_401/final)] :: Anaconda, Inc. on darwin 
Type "help", "copyright", "credits" or "license" for more information. 
>>> 


ou pour Linux : 


pierre@jeera:~$ python 
Python 3.7.1 (default, Dec 14 2018, 19:28:38) 


[GCC 7.3.0] :: Anaconda, Inc. on linux 

Type "help", "copyright", "credits" or "license" for more information. 
>>> 

Les blocs 


— PS C:\Users\pierre> pour Windows, 

— iMac-de-pierre:Downloads$ pour Mac OS X, 

— pierre@jeera:~$ pour Linux. 

représentent l’invite de commande de votre shell. Par la suite, cette invite de commande sera représentée simplement par 
le caractére $, que vous soyez sous Windows, Mac OS X ou Linux. 

Le triple chevron >>> est l’invite de commande (prompt en anglais) de l’interpréteur Python. Ici, Python attend une 
commande que vous devez saisir au clavier. Tapez par exemple l'instruction : 

print ("Hello world!") 

puis validez cette commande en appuyant sur la touche Entrée. 

Python a exécuté la commande directement et a affiché le texte Hello world!. Il attend ensuite votre prochaine instruc- 
tion en affichant l'invite de l’interpréteur Python (>>>). En résumé, voici ce qui a dû apparaître sur votre écran : 


>>> print("Hello world!") 

Hello world! 

>>> 

Vous pouvez refaire un nouvel essai en vous servant cette fois de l’interpréteur comme d’une calculatrice : 


>>> 1+1 
2 
>>> 6*3 
18 
À ce stade, vous pouvez entrer une autre commande ou bien quitter l’interpréteur Python, soit en tapant la commande 
exit () puis en validant en appuyant sur la touche Entrée, soit en pressant simultanément les touches Ctrl et D sous Linux et 
Mac OS X ou Ctrl et Z puis Entrée sous Windows. 
En résumant, l’interpréteur fonctionne sur le modèle : 
>>> instruction python 
résultat 
où le triple chevron correspond à |’ entrée (input) que l’utilisateur tape au clavier, et l’absence de chevron en début de ligne 
correspond à la sortie (output) générée par Python. Une exception se présente toutefois : lorsqu’on a une longue ligne de code, 
on peut la couper en deux avec le caractére \ (backslash) pour des raisons de lisibilité : 


>>> Voici une longue ligne de code \ 
décrite sur deux lignes 
résultat 
En ligne 1 on a rentré la première partie de la ligne de code. On termine par un \, ainsi Python sait que la ligne de code 
n’est pas finie. L'interpréteur nous l'indique avec les .... En ligne 2, on rentre la fin de la ligne de code puis on appuie sur 
Entrée. A ce moment, Python nous génére le résultat. Si la ligne de code est vraiment trés longue, il est méme possible de la 
découper en trois voire plus : 
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>>> Voici une ligne de code qui \ 


est vraiment très longue car \ 
elle est découpée sur trois lignes 
résultat 


L’interpréteur Python est donc un système interactif dans lequel vous pouvez entrer des commandes, que Python exécutera 
sous vos yeux (au moment où vous validerez la commande en appuyant sur la touche Entrée). 

Il existe de nombreux autres langages interprétés comme Perl 8 ou R°. Le gros avantage de ce type de langage est qu’on 
peut immédiatement tester une commande à l’aide de l’interpréteur, ce qui est très utile pour débugger (c’est-à-dire trouver et 
corriger les éventuelles erreurs d’un programme). Gardez bien en mémoire cette propriété de Python qui pourra parfois vous 
faire gagner un temps précieux ! 


1.6 Premier programme 


Bien sûr, l’interpréteur présente vite des limites dès lors que l’on veut exécuter une suite d’instructions plus complexe. 
Comme tout langage informatique, on peut enregistrer ces instructions dans un fichier, que l’on appelle communément un 
script (ou programme) Python. 

Pour reprendre l’exemple précédent, ouvrez un éditeur de texte (pour choisir et configurer un éditeur de texte, reportez- 
vous si nécessaire à la rubrique Installation de Python en ligne |) et entrez le code suivant : 

print ("Hello world!") 

Ensuite, enregistrez votre fichier sous le nom test . py, puis quittez l’éditeur de texte. 


Remarque 
L'extension de fichier standard des scripts Python est . py. 


Pour exécuter votre script, ouvrez un shell et entrez la commande : 
python test.py 
Vous devriez obtenir un résultat similaire à ceci : 


$ python test.py 
Hello world! 


Si c’est bien le cas, bravo! Vous avez exécuté votre premier programme Python. 


1.7 Commentaires 


Dans un script, tout ce qui suit le caractère # est ignoré par Python jusqu’à la fin de la ligne et est considéré comme un 
commentaire. 

Les commentaires doivent expliquer votre code dans un langage humain. L'utilisation des commentaires est rediscutée 
dans le chapitre 15 Bonnes pratiques en programmation Python. 


Voici un exemple : 


# Votre premier commentaire en Python. 
print ("Hello world!") 


# D'autres commandes plus utiles pourraient suivre. 


Remarque 
On appelle souvent à tort le caractère # « dièse ». On devrait plutôt parler de « croisillon !! ». 


8. http://www.perl.org 

9. http://www.r-project.org 

10. https://python.sdv.univ-paris-diderot.fr/livre-dunod 
11. https://fr.wikipedia.org/wiki/Croisillon_(signe) 
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taille <- 0 

séquence <- "ATCCGACTG" 

pour chaque base dans séquence: 
afficher (base) 


indentation 


taille <- taille + 1 
afficher (taille) + 


bloc d'instructions 


FIGURE 1.1 — Notion d’indentation et de bloc d’instructions. 


1.8 Notion de bloc d’instructions et d’indentation 


En programmation, il est courant de répéter un certain nombre de choses (avec les boucles, voir le chapitre 5 Boucles et 
comparaisons) ou d'exécuter plusieurs instructions si une condition est vraie (avec les tests, voir le chapitre 6 Tests). 

Par exemple, imaginons que nous souhaitions afficher chacune des bases d’une séquence d’ ADN, les compter puis afficher 
le nombre total de bases à la fin. Nous pourrions utiliser l’algorithme présenté en pseudo-code dans la figure 1.1. 

Pour chaque base de la séquence ATCCGACTG, nous souhaitons effectuer deux actions : d’abord afficher la base puis 
compter une base de plus. Pour indiquer cela, on décalera vers la droite ces deux instructions par rapport à la ligne précédente 
(pour chaque base [...]). Ce décalage est appelé indentation, et l’ensemble des lignes indentées constitue un bloc 
d’instructions. 

Une fois qu’on aura réalisé ces deux actions sur chaque base, on pourra passer à la suite, c’est-à-dire afficher la taille de 
la séquence. Pour bien préciser que cet affichage se fait à la fin, donc une fois l’affichage puis le comptage de chaque base 
terminés, la ligne correspondante n’est pas indentée (c’est-à-dire qu’elle n’est pas décalée vers la droite). 

Pratiquement, l’indentation en Python doit être homogène (soit des espaces, soit des tabulations, mais pas un mélange 
des deux). Une indentation avec 4 espaces est le style d’indentation recommandé (voir le chapitre 15 Bonnes pratiques en 
programmation Python). 

Si tout cela semble un peu complexe, ne vous inquiétez pas. Vous allez comprendre tous ces détails chapitre après chapitre. 


1.9 Autres ressources 


Pour compléter votre apprentissage de Python, n’hésitez pas à consulter d’autres ressources complémentaires à cet ou- 
vrage. D’autres auteurs abordent l’apprentissage de Python d’une autre manière. Nous vous conseillons les ressources sui- 
vantes en langue française : 

— Le livre Apprendre à programmer avec Python 3 de Gérard Swinnen. Cet ouvrage est téléchargeable gratuitement sur 

le site de Gérard Swinnen !?. Les éditions Eyrolles proposent également la version papier de cet ouvrage. 

— Le livre Apprendre à programmer en Python avec PyZo et Jupyter Notebook de Bob Cordeau et Laurent Pointal, publié 

aux éditions Dunod. Une partie de cet ouvrage est téléchargeable gratuitement sur le site de Laurent Pointal |”. 

— Le livre Apprenez à programmer en Python de Vincent Legoff '* que vous trouverez sur le site Openclassroms. 

Et pour terminer, une ressource incontournable en langue anglaise : 

— Le site www.python.org !>. Il contient énormément d'informations et de liens sur Python. La page d’index des mo- 

dules ! est particulièrement utile (et traduite en français). 


12. http://www.inforef.be/swi/python.htm 

13. https://perso.limsi.fr/pointal/python:courspython3 

14. https://openclassrooms.com/fr/courses/235344-apprenez-a-programmer-en-python 
15. http://www.python.org 

16. https://docs.python.org/fr/3/py-modindex.html 


Cours de Python / Université de Paris / UFR Sciences du Vivant 


13 


Chapitre 2 


Variables 


2.1 Définition 


Une variable est une zone de la mémoire de l’ordinateur dans laquelle une valeur est stockée. Aux yeux du programmeur, 
cette variable est définie par un nom, alors que pour l’ordinateur, il s’agit en fait d’une adresse, c’est-à-dire d’une zone 
particulière de la mémoire. 

En Python, la déclaration d’une variable et son initialisation (c’est-à-dire la première valeur que l’on va stocker dedans) 
se font en même temps. Pour vous en convaincre, testez les instructions suivantes après avoir lancé l’interpréteur : 


>>> x = 2 
>>> x 
2 


Ligne 1. Dans cet exemple, nous avons déclaré, puis initialisé la variable x avec la valeur 2. Notez bien qu’en réalité, il 
s’est passé plusieurs choses : 

— Python a « deviné » que la variable était un entier. On dit que Python est un langage au typage dynamique. 

— Python a alloué (réservé) l’espace en mémoire pour y accueillir un entier. Chaque type de variable prend plus ou moins 

d’espace en mémoire. Python a aussi fait en sorte qu’on puisse retrouver la variable sous le nom x. 

— Enfin, Python a assigné la valeur 2 à la variable x. 

Dans d’autres langages (en C par exemple), il faut coder ces différentes étapes une par une. Python étant un langage dit de 
haut niveau, la simple instruction x = 2 a suffi à réaliser les 3 étapes en une fois! 

Lignes 2 et 3. L’interpréteur nous a permis de connaître le contenu de la variable juste en tapant son nom. Retenez ceci 
car c’est une spécificité de l’interpréteur Python, très pratique pour chasser (debugger) les erreurs dans un programme. Par 
contre, la ligne d’un script Python qui contient seulement le nom d’une variable (sans aucune autre indication) n'affichera pas 
la valeur de la variable à l’écran lors de l’exécution (pour autant, cette instruction reste valide et ne générera pas d’erreur). 

Sachez par ailleurs que l’opérateur d’affectation = s’utilise dans un certain sens. Par exemple, l’instruction x = 2 signifie 
qu’on attribue la valeur située à droite de l’opérateur = (ici, 2) à la variable située à gauche (ici, x). D’autres langages de 
programmation comme R utilisent les symboles <- pour rendre |’ affectation d’une variable plus explicite, par exemple x <- 
2. 

Enfin, dans l'instruction x = y - 3, l’opération y - 3 est d’abord évaluée et ensuite le résultat de cette opération est 
affecté à la variable x. 


2.2 Les types de variables 


Le type d’une variable correspond à la nature de celle-ci. Les trois principaux types dont nous aurons besoin dans un 
premier temps sont les entiers (integer ou int), les nombres décimaux que nous appellerons floats et les chaînes de caractères 
(string ou str). Bien sûr, il existe de nombreux autres types (par exemple, les booléens, les nombres complexes, etc.). Si vous 
n’étes pas effrayés, vous pouvez vous en rendre compte ici |. 

Dans l’exemple précédent, nous avons stocké un nombre entier (int) dans la variable x, mais il est tout à fait possible de 
stocker des floats, des chaines de caractéres (string ou str) ou de nombreux autres types de variable que nous verrons par la 


suite : 


1. https://docs.python.org/fr/3.7/library/stdtypes .html 
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>>> y = 3.14 

>>> y 

3.14 

>>> a = "bonjour" 
>>> a 
‘bonjour 
>>> b = 'salut' 

>>> b 

‘salut 

>>> c = """girafe""" 
>>> c 
girafe 
>>> d = '''lion''' 
>>> d 

'lion' 


Remarque 

Python reconnaît certains types de variable automatiquement (entier, float). Par contre, pour une chaîne de caractères, il 
faut l’entourer de guillemets (doubles, simples, voire trois guillemets successifs doubles ou simples) afin d'indiquer à Python 
le début et la fin de la chaîne de caractères. 

Dans l’interpréteur, l’affichage direct du contenu d’une chaîne de caractères se fait avec des guillemets simples, quel que 
soit le type de guillemets utilisé pour définir la chaîne de caractères. 

En Python, comme dans la plupart des langages de programmation, c’est le point qui est utilisé comme séparateur décimal. 
Ainsi, 3.14 est un nombre reconnu comme un float en Python alors que ce n’est pas le cas de 3,14. 


2.3 Nommage 


Le nom des variables en Python peut être constitué de lettres minuscules (a à z), de lettres majuscules (A à Z), de nombres 
(0 à 9) ou du caractère souligné (_). Vous ne pouvez pas utiliser d’espace dans un nom de variable. 

Par ailleurs, un nom de variable ne doit pas débuter par un chiffre et il n’est pas recommandé de le faire débuter par le 
caractère _ (sauf cas très particuliers). 

De plus, il faut absolument éviter d’utiliser un mot « réservé » par Python comme nom de variable (par exemple : print, 
range, for, from, etc.). 

Enfin, Python est sensible à la casse, ce qui signifie que les variables TesT, test ou TEST sont différentes. 


24 Écriture scientifique 


On peut écrire des nombres très grands ou très petits avec des puissances de 10 en utilisant le symbole e : 


>>> 1e6 
1000000.0 
>>> 3.12e-3 
0.00312 


On appelle cela écriture ou notation scientifique. On pourra noter deux choses importantes : 

— 1e6 ou 3.12e-3 n’implique pas l’utilisation du nombre exponentiel e mais signifie 1 x 10% ou 3.12 x 107? respecti- 

vement ; 

— Même si on ne met que des entiers à gauche et à droite du symbole e (comme dans 1e6), Python génère systématique- 

ment un float. 

Enfin, vous avez sans doute constaté qu'il est parfois pénible d’ écrire des nombres composés de beaucoup de chiffres, par 
exemple le nombre d’ Avogradro 6.02214076 x 10% ou le nombre d'humains sur Terre (au 26 août 2020) 7807568245. Pour 
s’y retrouver, Python autorise l’utilisation du caractère « souligné » (ou underscore) _ pour séparer des groupes de chiffres. 
Par exemple : 


>>> avogadro_number = 6.022 _140_76e23 


>>> print (avogadro_number ) 
6.02214076e+23 
>>> humans_on_earth = 7_807_568_245 


>>> print (humans_on_earth) 
7807568245 


Dans ces exemples, le caractére _ est utilisé pour séparer des groupes de 3 chiffres mais on peut faire ce qu’on veut : 
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>>> print (7_80_7568_24_5) 
7807568245 


2.5 Opérations 


2.5.1 Opérations sur les types numériques 


Les quatre opérations arithmétiques de base se font de manière simple sur les types numériques (nombres entiers et floats) : 


>>> x = 45 
>>> x + 2 


>>> x - 


>>> x * 


me 
w 
a 

<N w N 


>>> y 
x 


42.5 
>>> (x * 10) + y 
452.5 


Remarquez toutefois que si vous mélangez les types entiers et floats, le résultat est renvoyé comme un float (car ce type 
est plus général). Par ailleurs, l’utilisation de parenthèses permet de gérer les priorités. 
L'opérateur / effectue une division. Contrairement aux opérateurs +, - et *, celui-ci renvoie systématiquement un float : 


>>> 3 / 4 
0.75 

>>> 2,5 Y 2 
1.25 


L'opérateur puissance utilise les symboles ** : 


>>> 2x*x*3 
8 
>>> 2**4 
16 


Pour obtenir le quotient et le reste d’une division entière (voir ici? pour un petit rappel sur la division entière), on utilise 
respectivement les symboles // et modulo % : 


>>> 5 // 4 
1 

>>> 5% 4 
1 


>>> 8 // 4 
2 


>>> 8% 4 

0 
Les symboles +, —, *, /, xx, // et sont appelés opérateurs, car ils réalisent des opérations sur les variables. 
Enfin, il existe des opérateurs « combinés » qui effectue une opération et une affectation en une seule étape : 


>>> i = 0 
>>> i = i + 1 
>>> i 


t 
>>> i += 1 
>>> i 


L'opérateur += effectue une addition puis affecte le résultat à la même variable. Cette opération s’appelle une « incrémen- 
tation ». 
Les opérateurs -=, *= et /= se comportent de manière similaire pour la soustraction, la multiplication et la division. 


2.5.2 Opérations sur les chaînes de caractères 


Pour les chaînes de caractères, deux opérations sont possibles, l’addition et la multiplication : 


2. https://fr.wikipedia.org/wiki/Division_euclidienne 
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>>> chaine = "Salut" 
>>> chaine 

"Salut ' 

>>> chaine + " Python" 


"Salut Python' 
>>> chaine * 3 
'SalutSalutSalut' 


L'opérateur d'addition + concaténe (assemble) deux chaînes de caractères. 


L'opérateur de multiplication * entre un nombre entier et une chaîne de caractères duplique (répète) plusieurs fois une 
chaîne de caractères. 


Attention 

Vous observez que les opérateurs + et * se comportent différemment s’il s’agit d’entiers ou de chaînes de caractères : 2 
+ 2 est une addition alors que "2" + "2" est une concaténation. On appelle ce comportement redéfinition des opérateurs. 
Nous serons amenés à revoir cette notion dans le chapitre 19 Avoir la classe avec les objets. 


2.5.3 Opérations illicites 


Attention à ne pas faire d’opération illicite car vous obtiendriez un message d’erreur : 


>>> "toto" * 1.3 


Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: can't multiply sequence by non-int of type 'float' 
>>> "toto" + 2 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: can only concatenate str (not "int") to str 


Notez que Python vous donne des informations dans son message d’ erreur. Dans le second exemple, il indique que vous 
devez utiliser une variable de type str c’est-à-dire une chaîne de caractères et pas un int, c’est-à-dire un entier. 


2.6 La fonction type () 


Si vous ne vous souvenez plus du type d’une variable, utilisez la fonction type () qui vous le rappellera. 


>>> x = 2 

>>> type(x) 
<class ‘int'> 
>>> y = 2.0 

>>> type(y) 
<class 'float'> 
>>> z= '2' 


>>> type (z) 
<class 'str'> 


Nous verrons plus tard ce que signifie le mot class. 


Attention 
Pour Python, la valeur 2 (nombre entier) est différente de 2.0 (float) et est aussi différente de '2' (chaîne de caractères). 


2.7 Conversion de types 


En programmation, on est souvent amené à convertir les types, c’est-à-dire passer d’un type numérique à une chaîne 
de caractères ou vice-versa. En Python, rien de plus simple avec les fonctions int (), float (O et str(). Pour vous en 
convaincre, regardez ces exemples : 


>>> i = 3 

>>> str(i) 

e 

>>> i = '456' 


>>> int(i) 
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456 

>>> float(i) 
456.0 

>>> i = '3.1416' 
>>> float(i) 
3.1416 


On verra au chapitre 7 Fichiers que ces conversions sont essentielles. En effet, lorsqu'on lit ou écrit des nombres dans un 
fichier, ils sont considérés comme du texte, donc des chaînes de caractères. 

Toute conversion d’une variable d’un type en un autre est appelé casting en anglais, il se peut que vous croisiez ce terme 
si vous consultez d’autres ressources. 


2.8 Note sur la division de deux nombres entiers 


Notez bien qu’en Python 3, la division de deux nombres entiers renvoie par défaut un float : 


>>> x = 3 / 4 
>>> x 

0.75 

>>> type(x) 
<class 'float'> 


Remarque 
Ceci n’était pas le cas en Python 2. Pour en savoir plus sur ce point, vous pouvez consulter le chapitre 21 Remarques 
complémentaires. 


2.9 Note sur le vocabulaire et la syntaxe 


Nous avons vu dans ce chapitre la notion de variable qui est commune à tous les langages de programmation. Toutefois, 
Python est un langage dit « orienté objet », il se peut que dans la suite du cours nous employions le mot objet pour désigner 
une variable. Par exemple, « une variable de type entier » sera pour nous équivalent à « un objet de type entier ». Nous verrons 
dans le chapitre 19 Avoir la classe avec les objets ce que le mot « objet » signifie réellement (tout comme le mot « classe »). 

Par ailleurs, nous avons rencontré plusieurs fois des fonctions dans ce chapitre, notamment avec type (), int (), float O 
et str(). Dans le chapitre 1 Introduction, nous avons également vu la fonction print (). On reconnaît qu’il s’agit d’une 
fonction car son nom est suivi de parenthèses (par exemple, type (O) ). En Python, la syntaxe générale est fonction(). 

Ce qui se trouve entre les parenthèses d’une fonction est appelé argument et c’est ce que l’on « passe » à la fonction. 
Dans l'instruction type (2), c’est l’entier 2 qui est l’argument passé à la fonction type(). Pour P' instant, on retiendra qu’une 
fonction est une sorte de boîte à qui on passe un (ou plusieurs) argument(s), qui effectue une action et qui peut renvoyer un 
résultat ou plus généralement un objet. Par exemple, la fonction type() renvoie le type de la variable qu’on lui a passé en 
argument. 

Si ces notions vous semblent obscures, ne vous inquiétez pas, au fur et à mesure que vous avancerez dans le cours, tout 
deviendra limpide. 


2.10 Minimum et maximum 


Python propose les fonctions min() etmax() qui renvoient respectivement le minimum et le maximum de plusieurs entiers 
et / ou floats : 
>>> min(1, -2, 4) 
-2 
>>> pi = 3.14 
>>> e = 2.71 
>>> max(e, pi) 
3.14 
>>> max(1, 2.4, -6) 
2.4 
Par rapport à la discussion de la rubrique précédente, min() et max() sont des exemples de fonction prenant plusieurs 
arguments. En Python, quand une fonction prend plusieurs arguments, on doit les séparer par une virgule. min() et max() 


prennent en argument autant d’entiers et de floats que l’on veut, mais il en faut au moins deux. 
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2.11 Exercices 


Conseil : utilisez l’interpréteur Python pour les exercices suivants. 


2.11.1 Prédire le résultat : opérations 


Essayez de prédire le résultat de chacune des instructions suivantes, puis vérifiez-le dans l’interpréteur Python : 


— (1+2)**3 

— "Da" * 4 

— "Da" +3 

— ("Pa"+"La") x 2 
— ("Da"x4) / 2 
— 5/2 

— 5//2 

— 5% 2 


2.11.2 Prédire le résultat : opérations et conversions de types 


Essayez de prédire le résultat de chacune des instructions suivantes, puis vérifiez-le dans l’interpréteur Python : 


— str(4) * int("3") 

— int("3") + float ("3.2") 
— str(3) * float("3.2") 
— str(3/4) * 2 
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Chapitre 3 


Affichage 


3.1 La fonction print () 


Dans le chapitre 1, nous avons rencontré la fonction print() qui affiche une chaîne de caractères (le fameux "Hello 
world!"). En fait, la fonction print O affiche l’argument qu’on lui passe entre parenthèses et un retour à ligne. Ce retour à 
ligne supplémentaire est ajouté par défaut. Si toutefois, on ne veut pas afficher ce retour à la ligne, on peut utiliser l’argument 
par « mot-clé » end : 


>>> print ("Hello world!") 

Hello world! 

>>> print ("Hello world!", end="") 

Hello world!>>> 

Ligne 1. On a utilisé l’instruction print () classiquement en passant la chaîne de caractères "Hello world!" en argu- 
ment. 

Ligne 3. On a ajouté un second argument end="", en précisant le mot-clé end. Nous aborderons les arguments par mot-clé 
dans le chapitre 9 Fonctions. Pour l’instant, dites-vous que cela modifie le comportement par défaut des fonctions. 

Ligne 4. L'effet de l’argument end="" est que les trois chevrons >>> se retrouvent collés après la chaîne de caractères 
"Hello world!". 

Une autre manière de s’en rendre compte est d’utiliser deux fonctions print () à la suite. Dans la portion de code suivante, 
le caractère « ; » sert à séparer plusieurs instructions Python sur une même ligne : 

>>> print ("Hello") ; print ("Joe") 

Hello 

Joe 

>>> print ("Hello", end="") ; print ("Joe") 

HelloJoe 

>>> print("Hello", end=" ") ; print ("Joe") 

Hello Joe 

La fonction print () peut également afficher le contenu d’une variable quel que soit son type. Par exemple, pour un 
entier : 


>>> var = 3 
>>> print(var) 
3 


Il est également possible d’afficher le contenu de plusieurs variables (quel que soit leur type) en les séparant par des 
virgules : 

>>> x = 32 

>>> nom = "John" 

>>> print(nom, "a", x, "ans") 

John a 32 ans 

Python a écrit une phrase complète en remplaçant les variables x et nom par leur contenu. Vous remarquerez que pour 
afficher plusieurs éléments de texte sur une seule ligne, nous avons utilisé le séparateur « , » entre les différents éléments. 
Python a également ajouté un espace à chaque fois que l’on utilisait le séparateur « , ». On peut modifier ce comportement en 
passant à la fonction print () l’argument par mot-clé sep : 


>>> x = 32 
>>> nom = "John" 
>>> print(nom, "a", x, "ans 


20 


3.2. Écriture formatée Chapitre 3. Affichage 


Johna32ans 
>>> print(nom, "a", x, "ans", sep="-") 
John-a-32-ans 


Pour afficher deux chaînes de caractères l’une à côté de l’autre, sans espace, on peut soit les concaténer, soit utiliser 
l’argument par mot-clé sep avec une chaîne de caractères vide : 


>>> anil "chat" 

>>> ani2 "souris" 

>>> print(anii, ani2) 

chat souris 

>>> print(anii + ani2) 
chatsouris 

>>> print(anii, ani2, sep="") 
chatsouris 


3.2 Écriture formatée 


3.2.1 Définitions 


Que signifie « écriture formatée » ? 


Définition 

L'écriture formatée est un mécanisme permettant d’afficher des variables avec un certain format, par exemple justifiées 
à gauche ou à droite, ou encore avec un certain nombre de décimales pour les floats. L’ écriture formatée est incontournable 
lorsqu’on veut créer des fichiers organisés en « belles colonnes » comme par exemple les fichiers PDB (pour en savoir plus 
sur ce format, reportez-vous à l’annexe À Quelques formats de données rencontrés en biologie). 


Depuis la version 3.6, Python a introduit les f-strings pour mettre en place l’écriture formatée que nous allons décrire en 
détail dans cette rubrique. Il existe d’autres manières pour formatter des chaînes de caractères qui étaient utilisées avant la 
version 3.6, nous en avons mis un rappel bref dans la rubrique suivante. Toutefois, nous conseillons vivement l’utilisation des 
f-strings si vous débutez l’ apprentissage de Python. 

Que signifie f-string ? 


Définition 
f-string est le diminutif de formatted string literals. Mais encore? Dans le chapitre précédent, nous avons vu les chaînes 
de caractéres ou encore strings qui étaient représentées par un texte entouré de guillemets simples ou doubles. Par exemple : 


"Ceci est une chaine de caractéres" 


L’équivalent en f-string est tout simplement la même chaîne de caractères précédée du caractère f sans espace entre les 
deux : 


f"Ceci est une chaîne de caractères" 


Ce caractère f avant les guillemets va indiquer à Python qu'il s’agit d'une f-string permettant de mettre en place le 
mécanisme de l’écriture formatée, contrairement à une string normale. 


Nous expliquons plus en détail dans le chapitre 10 Plus sur les chaînes de caractères pourquoi on doit mettre ce f et le 
mécanisme sous-jacent. 


3.2.2 Prise en main des f-strings 


Les f-strings permettent une meilleure organisation de l’affichage des variables. Reprenons l’exemple ci-dessus à propos 
de notre ami John : 
>>> x = 32 


>>> nom = "John" 


>>> print (f"{nom} a {x} ans") 
John a 32 ans 
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Il suffit de passer un nom de variable au sein de chaque couple d’accolades et Python les remplace par leur contenu! 
Première remarque, la syntaxe apparait plus lisible que l’équivalent vu ci-avant print(nom, "a", x, "ans"). Bien sûr, il 
ne faut pas omettre le f avant le premier guillemet, sinon Python prendra cela pour une chaîne de caractères normale et ne 
mettra pas en place ce mécanisme de remplacement : 


>>> print ("{nom} a {x} ans") 
{nom} a {x} ans 


Remarque 
Une variable est utilisable plus d’une fois pour une f-string donnée : 


>>> var = "to" 

>>> print(f"{var} et {var} font {var}{var}") 
to et to font toto 

>>> 


Enfin, il est possible de mettre entre les accolades des valeurs numériques ou des chaînes de caractères : 


>>> print (f"J'affiche l'entier {10} et le float {3.14}") 
J'affiche l'entier 10 et le float 3.14 

>>> print(f"J'affiche la chaine {'Python'}") 

J'affiche la chaine Python 


Même si cela ne présente que peu d’intérêt pour l’instant, il s’agit d’une commande Python parfaitement valide. Nous 
verrons des exemples plus pertinents par la suite. Cela fonctionne avec n’importe quel type de variable (entiers, chaines de 
caractères, floats, etc.). Attention toutefois pour les chaînes de caractères, utilisez des guillemets simples au sein des accolades 
si vous définissez votre f-string avec des guillemets doubles. 


3.2.3 Spécification de format 


Les f-strings permettent de remplacer des variables au sein d’une chaîne de caractères. On peut également spécifier le 
format de leur affichage. 

Prenons un exemple. Imaginez maintenant que vous vouliez calculer, puis afficher, la proportion de GC d’un génome. La 
proportion de GC s’obtient comme la somme des bases Guanine (G) et Cytosine (C) divisée par le nombre total de bases (A, T, 
C, G) du génome considéré. Si on a, par exemple, 4500 bases G et 2575 bases C, pour un total de 14800 bases, vous pourriez 
procéder comme suit (notez bien l’utilisation des parenthèses pour gérer les priorités des opérateurs) : 

>>> prop_GC = (4500 + 2575) / 14800 


>>> print ("La proportion de GC est", prop_GC) 
La proportion de GC est 0.4780405405405405 


Le résultat obtenu présente trop de décimales (seize dans le cas présent). Pour écrire le résultat plus lisiblement, vous 
pouvez spécifier dans les accolades {} le format qui vous intéresse. Dans le cas présent, vous voulez formater un float pour 
l afficher avec deux puis trois décimales : 

>>> print(f"La proportion de GC est {prop_GC:.2f}") 
La proportion de GC est 0.48 


>>> print(f"La proportion de GC est {prop_GC:.3f}") 
La proportion de GC est 0.478 


Détaillons le contenu des accolades de la première ligne ({prop_GC: .2f}): 

— D'abord on a le nom de la variable a formatter, prop_GC, c’est indispensable avec les f-strings. 

— Ensuite on rencontre les deux-points :, ceux-ci indiquent que ce qui suit va spécifier le format dans lequel on veut 
afficher la variable prop_GC. 

— A droite des deux-points on trouve .2f qui indique ce format : la lettre £ indique qu’on souhaite afficher la variable 
sous forme d’un float, les caractères .2 indiquent la précision voulue, soit ici deux chiffres après la virgule. 

Notez enfin que le formatage avec .xf (x étant un entier positif) renvoie un résultat arrondi. 

Vous pouvez aussi formater des entiers avec la lettre d (ici d veut dire decimal integer) : 


>>> nb_G = 4500 
>>> print(f"Ce génome contient {nb_G:d} guanines") 
Ce génome contient 4500 guanines 


ou mettre plusieurs nombres dans une méme chaine de caractéres. 
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>>> nb_G = 4500 

>>> nb C 2575 

>>> print(f"Ce génome contient {nb_G:d} G et {nb_C:d} C, soit une prop de GC de {prop_GC:.2f}") 
Ce génome contient 4500 G et 2575 C, soit une prop de GC de 0.48 

>>> perc_GC = prop_GC * 100 

>>> print(f"Ce génome contient {nb_G:d} G et {nb_C:d} C, soit un %GC de {perc_GC:.2f} 4") 

Ce génome contient 4500 G et 2575 C, soit un %GC de 47.80 % 


Enfin, il est possible de préciser sur combien de caractères vous voulez qu’un résultat soit écrit et comment se fait l’ali- 
gnement (à gauche, à droite ou centré). Dans la portion de code suivante, le caractère ; sert de séparateur entre les instructions 
sur une même ligne : 


>>> print (10) ; print (1000) 

10 

1000 

>>> print (f"{10:>6d}") ; print(f"{1000:>64}") 
10 


1000 
>>> print (f"{10:<6d}") ; print (f"{1000:<64}") 
10 
1000 


>>> print (£"{10:"6d}") ; print (f£"{1000:~6d}") 
10 

1000 

>>> print (f"{10:*°6d}") ; print (f£"{1000:*"6d}") 

**10** 

*1000x 

>>> print (£"{10:0>6d}") ; print(f"(1000:0>6d)") 

000010 

001000 

Notez que > spécifie un alignement à droite, < spécifie un alignement à gauche et ^ spécifie un alignement centré. Il 
est également possible d’indiquer le caractère qui servira de remplissage lors des alignements (l’espace est le caractère par 
défaut). 


Ce formatage est également possible sur des chaînes de caractères avec la lettre s (comme string) : 


>>> print ("atom HN") ; print ("atom HDE1") 

atom HN 

atom HDE1 

>>> print(f"atom {'HN':>4s}") ; print(f"atom {'HDE1':>4s}") 

atom HN 

atom HDE1 

Vous voyez tout de suite l’énorme avantage de l’écriture formatée. Elle vous permet d’écrire en colonnes parfaitement 
alignées. Nous verrons que ceci est très pratique si l’on veut écrire les coordonnées des atomes d’une molécule au format PDB 
(pour en savoir plus sur ce format, reportez-vous à l’annexe A Quelques formats de données rencontrés en biologie). 


Pour les floats, il est possible de combiner le nombre de caractères à afficher avec le nombre de décimales : 


>>> print (f"{perc_GC:7.3f}") 
47.804 
>>> print (f"{perc_GC:10.3f}") 
47.804 
L’instruction 7 . 3f signifie que l’on souhaite écrire un float avec 3 décimales et formaté sur 7 caractères (par défaut justifiés 
à droite). L’instruction 10.3f fait la même chose sur 10 caractères. Remarquez que le séparateur décimal . compte pour un 
caractère. De même, si on avait un nombre négatif, le signe - compterait aussi pour un caractère. 


3.2.4 Autres détails sur les f-strings 


Si on veut afficher des accolades littérales avec les f-strings, il faut les doubler pour échapper au formatage : 


>>> print(f"Accolades littérales {{}} ou {{ ou }} et pour le formatage {10}") 

Accolades littérales {} ou { ou } et pour le formatage 10 

Une remarque importante, si on ne met pas de variable à formater entre les accolades dans une f-string, cela conduit à une 
erreur : 


>>> print(f"accolades sans variable {}") 
File "<stdin>", line 1 
SyntaxError: f-string: empty expression not allowed 
Enfin, il est important de bien comprendre qu’une f-string est indépendante de la fonction print (). Si on donne une 
f-string à la fonction print (), Python évalue d’abord la f-string et c’est la chaîne de caractères qui en résulte qui est affichée 
à l’écran. Tout comme dans l’instruction print (5*5), c’est d’abord la multiplication (5*5) qui est évaluée, puis son résultat 
qui est affiché à l’écran. On peut s’en rendre compte de la manière suivante dans l’interpréteur : 
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>>> £"{perc_GC:10.3f}" 
! 47.804' 


>>> type(f"{perc_GC:10.3f}") 
<class 'str'> 


Python considere le résultat de l'instruction f"{perc_GC:10.3f}" comme une chaîne de caractères et la fonction type O 
nous le confirme. 


3.2.5 Expressions dans les f-strings 


Une fonctionnalité extrêmement puissante des f-strings est de supporter des expressions Python au sein des accolades. 
Ainsi, il est possible d’y mettre directement une opération ou encore un appel à une fonction : 

>>> print(f"Le résultat de 5 * 5 vaut {5 * 5}") 

Le résultat de 5 * 5 vaut 25 

>>> print(f"Résultat d'une opération avec des floats : {(4.1 * 6.7)}") 

Résultat d'une opération avec des floats : 27.47 

>>> print(f"Le minimum est {min(1, -2, 4)}") 


Le minimum est -2 
>>> entier = 2 


>>> print(f"Le type de {entier} est {type(entier)}") 
Le type de 2 est <class 'int'> 


Nous aurons l’occasion de revenir sur cette fonctionnalité au fur et à mesure de ce cours. 


3.3 Écriture scientifique 


Pour les nombres très grands ou très petits, l’écriture formatée permet d’afficher un nombre en notation scientifique (sous 
forme de puissance de 10) avec la lettre e : 
>>> print (f"{1_000_000_000:e}") 
1.000000e+09 


>>> print (f"{0.000_000_001:e}") 
1.000000e-09 


Il est également possible de définir le nombre de chiffres après la virgule. Dans l’exemple ci-dessous, on affiche un nombre 
avec aucun, 3 et 6 chiffres aprés la virgule : 


>>> avogadro_number = 6.022_140_76e23 
>>> print (f"{avogadro_number:.0e}") 
6e+23 

>>> print (f"{avogadro_number:.3e}") 
6.022e+23 


>>> print (f"{avogadro_number:.6e}") 
6.022141e+23 


3.4 Ancienne méthode de formatage des chaînes de caractères 


Conseil : Pour les débutants, tout ce qui est écrit dans cette rubrique n’est pas à retenir. 

Dans les premières versions de Python jusqu’à la 2.6, il fallait utiliser l’opérateur %, puis de la version 2.7 jusqu’à la 3.5 il 
était plutôt conseillé d’utiliser la méthode . format () (voir la rubrique suivante pour la définition du mot « méthode »). Même 
si les f-strings sont devenues la manière conseillée pour mettre en place l’écriture formatée, ces deux anciennes manières, sont 
encore pleinement compatibles avec les versions modernes de Python. 

Même si elle fonctionne encore, la première manière avec l’opérateur % est maintenant clairement déconseillée pour un 
certain nombre de raisons |. Néanmoins, nous rappelons ci-dessous son fonctionnement, car il se peut que vous tombiez dessus 
dans d’anciens livres ou si vous lisez de vieux programmes Python. 

La deuxième manière avec la méthode . format () est encore largement utilisée et reste tout à fait valide. Elle est clai- 
rement plus puissante et évite un certain nombre de désagréments par rapport à l’opérateur %. Vous la croiserez sans doute 
très fréquemment dans des programmes et ouvrages récents. Heureusement elle a un fonctionnement relativement proche des 
f-strings, donc vous ne serez pas totalement perdus ! 

Enfin, nous indiquons à la fin de cette rubrique nos conseils sur quelle méthode utiliser. 


1. https://docs.python.org/fr/3/library/stdtypes.html?highlight=sprintf#printf-style-string-formatting 
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3.4.1 L'opérateur 7, 


On a vu avec les entiers que l’opérateur % ou modulo renvoyait le reste d’une division entière. Cet opérateur existe aussi 
pour les chaînes de caractères mais il met en place l’écriture formatée. En voici un exemple : 


>>> x = 32 

>>> nom = "John" 

>>> print("%Zs a %d ans" % (nom, x)) 

John a 32 ans 

>>> nb_G = 4500 

>>> nb_C 2575 

>>> prop_GC = (nb_G + nb_C)/14800 

>>> print("0n a 4d G et %d C -> prop GC = %.2f" % (nb_G, nb_C, prop_GC)) 
On a 4500 G et 2575 C -> prop GC = 0.48 


La syntaxe est légèrement différente. Le symbole % est d’abord appelé dans la chaîne de caractères (dans l’exemple ci- 
dessus %d, %d et %.2f) pour : 

— Désigner l’endroit où sera placée la variable dans la chaîne de caractères. 

— Préciser le type de variable à formater, d pour un entier (i fonctionne également) ou f pour un float. 

— Éventuellement pour indiquer le format voulu. Ici .2 signifie une précision de deux décimales. 

Le signe % est rappelé une seconde fois (4 (nb_G, nb_C, prop_GC)) pour indiquer les variables à formater. 


3.4.2 La méthode . format () 


Depuis la version 2.7 de Python, la méthode .format() (voir la rubrique suivante pour la définition d’une méthode) a 
apporté une nette amélioration pour mettre en place l’écriture formatée. Celle-ci fonctionne de la manière suivante : 


>>> x = 32 

>>> nom = "John" 

>>> print ("{} a {} ans'".format (nom, x)) 

John a 32 ans 

>>> nb_G = 4500 

>>> nb_C = 2575 

>>> prop_GC = (nb_G + nb_C)/14800 

>>> print ("On a {} G et {} C -> prop GC = {:.2f}".format(nb_G, nb_C, prop_GC)) 
On a 4500 G et 2575 C -> prop GC = 0.48 


— Dans la chaîne de caractères, les accolades vides {} précisent l’endroit où le contenu de la variable doit être inséré. 
— Juste après la chaîne de caractères, l’instruction .format(nom, x) fournit la liste des variables à insérer, d’abord la 
variable nom puis la variable x. 

— On peut éventuellement préciser le formatage en mettant un caractère deux-points : puis par exemple ici .2f qui 

signifie 2 chiffres après la virgule. 

— La méthode .format() agit sur la chaîne de caractères à laquelle elle est attachée par le point. 

Tout ce que nous avons vu avec les f-strings sur la manière de formatter l’affichage d’une variable (après les : au sein 
des accolades) est identique avec la méthode . format (). Par exemple {:.2f}, {:0>6d}, {:.6e}, etc., fonctionneront de la 
même manière. La différence notable est qu’on ne met pas directement le nom de la variable au sein des accolades. Comme 
pour l’opérateur %, c’est l’emplacement dans les arguments passés à la méthode .format() qui dicte quelle variable doit 
être remplacée. Par exemple, dans "{} {} {}".format(bidule, machin, truc), les premières accolades remplaceront 
la variable bidule, les deuxièmes la variable machin, les troisièmes la variable truc. 

Le formattage avec la méthode . format () se rapproche de la syntaxe des f-strings (accolades, deux-points), mais présente 
l'inconvénient — comme avec l’opérateur Y — de devoir mettre la liste des variables tout à la fin, alourdissant ainsi la syntaxe. 
En effet, dans l’exemple avec la proportion de GC, la ligne équivalente avec une f-string apparait tout de même plus simple à 
lire : 


>>> print(f"On a {nb_G} G et {nb_C} C -> prop GC = {prop_GC:.2f}") 
On a 4500 G et 2575 C -> prop GC = 0.48 


Conseil 

Pour conclure, ces deux anciennes façons de formater une chaîne de caractères avec l’opérateur % ou la méthode . format () 
vous sont présentées à titre d’information. La première avec l’opérateur % est clairement déconseillée. La deuxième avec la 
méthode . format () est encore tout à fait valable. Si vous débutez Python, nous vous conseillons fortement d’apprendre et 
d utiliser les f-strings. C’est ce que vous rencontrerez dans la suite de ce cours. Si vous connaissez déjà Python et que vous 
utilisez la méthode . format (), nous vous conseillons de passer aux f-strings. Depuis que nous les avons découvertes, aucun 
retour n’est envisageable pour nous tant elles sont puissantes et plus claires à utiliser ! 
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Enfin, si vous souhaitez aller plus loin, voici deux articles en anglais très bien fait sur le site RealPython : sur l’écriture 
formatée ? et sur les f-strings * 


3.5 Note sur le vocabulaire et la syntaxe 


Revenons quelques instants sur la notion de méthode abordée dans ce chapitre avec . format (). En Python, on peut 
considérer chaque variable comme un objet sur lequel on peut appliquer des méthodes. Une méthode est simplement une 
fonction qui utilise et/ou agit sur l’objet lui-même, les deux étant connectés par un point. La syntaxe générale est de la forme 
objet.méthode(). 

Dans l’exemple suivant : 


>>> "Joe a {} ans".format (20) 
‘Joe a 20 ans' 


la méthode . format () est liée à "Joe a {} ans" qui est un objet de type chaîne de caractères. La méthode renvoie une 
nouvelle chaîne de caractères avec le bon formatage (ici, 'Joe a 20 ans'). 
Nous aurons de nombreuses occasions de revoir cette notation objet.méthode(). 


3.6 Exercices 


Conseil : utilisez l’interpréteur Python pour les exercices 2 à 5. 


3.6.1 Affichage dans l’interpréteur et dans un programme 


Ouvrez l'interpréteur Python et tapez l’instruction 1+1. Que se passe-t-il ? 

Écrivez la même chose dans un script test .py que vous allez créer avec un éditeur de texte. Exécutez ce script en 
tapant python test.py dans un shell. Que se passe-t-il ? Pourquoi ? Faites en sorte d’afficher le résultat de l’addition 1+1 en 
exécutant le script dans un shell. 


3.6.2 Poly-A 


Générez une chaîne de caractères représentant un brin d’ ADN poly-A (c’est-à-dire qui ne contient que des bases A) de 20 
bases de longueur, sans taper littéralement toutes les bases. 


3.6.3 Poly-A et poly-GC 


Sur le modèle de l’exercice précédent, générez en une ligne de code un brin d’ ADN poly-A (AAAA...) de 20 bases suivi 
d’un poly-GC régulier (GCGCGC. ..) de 40 bases. 


3.64 Écriture formatée 


En utilisant l’écriture formatée, affichez en une seule ligne les variables a, b et c dont les valeurs sont respectivement la 
chaîne de caractères "salut", le nombre entier 102 et le float 10.318. La variable c sera affichée avec 2 décimales. 


3.6.5 Écriture formatée 2 


Dans un script percGC.py, calculez un pourcentage de GC avec l’instruction suivante : 

perc_GC = ((4500 + 2575)/14800)x100 

Ensuite, affichez le contenu de la variable perc_GC à l’écran avec 0, 1, 2 puis 3 décimales sous forme arrondie en utilisant 
T écriture formatée et les f-strings. On souhaite que le programme affiche la sortie suivante : 


2. https://realpython.com/python-string-formatting 
3. https://realpython.com/python-f-strings/ 
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Chapitre 3. Affichage 


Le 
Le 
Le 
Le 
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48 
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47.804 
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Chapitre 4 


Listes 


4.1 Définition 


Une liste est une structure de données qui contient une série de valeurs. Python autorise la construction de liste contenant 
des valeurs de types différents (par exemple entier et chaîne de caractères), ce qui leur confère une grande flexibilité. Une liste 
est déclarée par une série de valeurs (n’oubliez pas les guillemets, simples ou doubles, s’il s’agit de chaînes de caractères) 
séparées par des virgules, et le tout encadré par des crochets. En voici quelques exemples : 

>>> animaux = ["girafe", "tigre", "singe", "souris"] 
>>> tailles = [5, 2.5, 1.75, 0.15] 

>>> mixte = ["girafe", 5, "souris", 0.15] 

>>> animaux 

['girafe', 'tigre', 'singe', 'souris'] 

>>> tailles 


[5, 2.5, 1.75, 0.15] 
>>> mixte 


['girafe', 5, 'souris', 0.15] 


Lorsque l’on affiche une liste, Python la restitue telle qu’elle a été saisie. 


4.2 Utilisation 


Un des gros avantages d’une liste est que vous pouvez appeler ses éléments par leur position. Ce numéro est appelé indice 
(ou index) de la liste. 

liste : ["girafe", "tigre", "singe", "souris"] 

indice 0 1 

Soyez très attentifs au fait que les indices d’une liste de n éléments commence à 0 et se termine à n-/. Voyez l’exemple 
suivant : 

>>> animaux = ["girafe", "tigre", "singe", "souris"] 

>>> animaux [0] 

'girafe' 

>>> animaux [1] 

'tigre' 

>>> animaux [3] 

'souris' 


Par conséquent, si on appelle l’élément d'indice 4 de notre liste, Python renverra un message d’erreur : 


>>> animaux [4] 


Traceback (innermost last): 
File "<stdin>", line 1, in ? 
IndexError: list index out of range 


N'oubliez pas ceci ou vous risquez d’ obtenir des bugs inattendus ! 


4.3 Opération sur les listes 


Tout comme les chaînes de caractères, les listes supportent l’opérateur + de concaténation, ainsi que l’opérateur * pour la 
duplication : 
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>>> anii = ["girafe", "tigre"] 

>>> ani2 = ["singe", "souris"] 

>>> anil + ani2 

['girafe', 'tigre', 'singe', 'souris'] 

>>> anil * 3 

['girafe', 'tigre', 'girafe', 'tigre', 'girafe', 'tigre'] 


L'opérateur + est très pratique pour concaténer deux listes. 
Vous pouvez aussi utiliser la méthode .append() lorsque vous souhaitez ajouter un seul élément à la fin d’une liste. 
Dans l’exemple suivant nous allons créer une liste vide : 


>>> a = [] 
>>> a 


[] 


puis lui ajouter deux éléments, l’un après l’autre, d’abord avec la concaténation : 
>>> a = a + [15] 
>>> a 
[15] 
>>> a =a + [-5] 
>>> a 
[15, -5] 


puis avec la méthode .append() : 


>>> a.append(13) 
>>> a 


[15, -5, 13] 
>>> a.append(-3) 
>>> a 


Lis. «36:5. 48, 8] 


Dans l’exemple ci-dessus, nous ajoutons des éléments à une liste en utilisant l’opérateur de concaténation + ou la méthode 
.append (). Nous vous conseillons dans ce cas précis d’utiliser la méthode . append () dont la syntaxe est plus élégante. 
Nous reverrons en détail la méthode .append() dans le chapitre 11 Plus sur les listes. 


4.4 Indicage négatif 


La liste peut également être indexée avec des nombres négatifs selon le modèle suivant : 


liste : ["girafe", "tigre", "singe", "souris"] 
indice positif : 0 1 2 3 
indice négatif : -4 -3 #2 -1 
ou encore : 

liste : cha" Hn “ou "pt" MES "EN 

indice positif : 0 1 2 3 4 5 

indice négatif : -6 -5 -4 23 -2 =1 


Les indices négatifs reviennent à compter à partir de la fin. Leur principal avantage est que vous pouvez accéder au dernier 
élément d’une liste à l’aide de l'indice -1 sans pour autant connaître la longueur de cette liste. L’ avant-dernier élément a lui 
l’indice -2, l’avant-avant dernier l’indice -3, etc. 

>>> animaux = ["girafe", "tigre", "singe", "souris"] 
>>> animaux[-1] 

' souris ' 

>>> animaux [-2] 

'singe' 

Pour accéder au premier élément de la liste avec un indice négatif, il faut par contre connaître le bon indice : 

>>> animaux[-4] 
'girafe' 


Dans ce cas, on utilise plutót animaux [0]. 


4.5 Tranches 


Un autre avantage des listes est la possibilité de sélectionner une partie d’une liste en utilisant un indiçage construit sur le 
modèle [m:n+1] pour récupérer tous les éléments, du émième au énième (de l’élément m inclus à l’élément n+1 exclu). On 
dit alors qu’on récupère une tranche de la liste, par exemple : 
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>>> animaux = ["girafe", "tigre", "singe", "souris"] 
>>> animaux [0:2] 

['girafe', 'tigre'] 

>>> animaux [0:3] 

['girafe', 'tigre', 'singe'] 

>>> animaux[0:] 

['girafe', 'tigre', 'singe', 'souris'] 
>>> animaux[:] 

['girafe', 'tigre', 'singe', 'souris'] 
>>> animaux [1:] 

['tigre', 'singe', 'souris'] 

>>> animaux [1:-1] 

['tigre', 'singe'] 


Notez que lorsqu’aucun indice n’est indiqué à gauche ou à droite du symbole deux-points, Python prend par défaut tous 
les éléments depuis le début ou tous les éléments jusqu’à la fin respectivement. 


On peut aussi préciser le pas en ajoutant un symbole deux-points supplémentaire et en indiquant le pas par un entier. 


>>> animaux = ["girafe", "tigre", "singe", "souris"] 
>>> animaux [0:3:2] 

['girafe', 'singe'] 

>>> x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 

>>> x 
[o, 1 
>>> x 

[o, 1, 

>>> x[::2] 
[0, 2 

>>> x 

[o, 3 

>>> x[1:6:3] 
[1, 4] 


Finalement, on se rend compte que l’accès au contenu d’une liste fonctionne sur le modèle liste [début :fin: pas]. 


4.6 Fonction len() 


L'instruction len() vous permet de connaître la longueur d’une liste, c’est-à-dire le nombre d’ éléments que contient la 
liste. Voici un exemple d'utilisation : 


>>> animaux = ["girafe", "tigre", "singe", "souris"] 
>>> len(animaux) 

4 

>>> len([1, 2, 3, 4, 5, 6, 7, 8]) 

8 


4.7 Les fonctions range () et list () 


L'instruction range () est une fonction spéciale en Python qui génère des nombres entiers compris dans un intervalle. 
Lorsqu elle est utilisée en combinaison avec la fonction list (), on obtient une liste d’entiers. Par exemple : 


>>> list (range (10)) 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


La commande list(range(10)) a généré une liste contenant tous les nombres entiers de O inclus à 10 exclu. Nous 
verrons l’utilisation de la fonction range () toute seule dans le chapitre 5 Boucles et comparaisons. 


Dans l’exemple ci-dessus, la fonction range() a pris un argument, mais elle peut également prendre deux ou trois argu- 
ments, voyez plutót : 


>>> list(range(0, 5)) 

[0, 1, 2, 3, 4] 

>>> list(range(15, 20)) 

[15, 16, 17, 18, 19] 

>>> list(range(0, 1000, 200)) 
[0, 200, 400, 600, 800] 

>>> list(range(2, -2, -1)) 
[2, 1, 0, -1] 
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L'instruction range() fonctionne sur le modèle range([début,] fin[, pas]). Les arguments entre crochets sont 
optionnels. Pour obtenir une liste de nombres entiers, il faut l’utiliser systématiquement avec la fonction list (O. 
Enfin, prenez garde aux arguments optionnels par défaut (0 pour début et 1 pour pas) : 


>>> list (range (10,0)) 
(1 


Ici la liste est vide car Python a pris la valeur du pas par défaut qui est de 1. Ainsi, si on commence à 10 et qu’on avance par 
pas de 1, on ne pourra jamais atteindre O. Python génère ainsi une liste vide. Pour éviter ça, il faudrait, par exemple, préciser 
un pas de -1 pour obtenir une liste d’entiers décroissants : 


>>> list(range(10,0,-1)) 
[10, 9, 8, 7, 6, 5, 4, 3, 2, 1] 


4.8 Listes de listes 


Pour finir, sachez qu'il est tout à fait possible de construire des listes de listes. Cette fonctionnalité peut parfois être très 
pratique. Par exemple : 


>>> enclosi ["girafe", 4] 

>>> enclos2 ["tigre", 2] 

>>> enclos3 ["singe", 5] 

>>> zoo = [enclosi, enclos2, enclos3] 
>>> zoo 


[['girafe', 4], ['tigre', 2], ['singe', 5]] 


Dans cet exemple, chaque sous-liste contient une catégorie d'animal et le nombre d'animaux pour chaque catégorie. 
Pour accéder à un élément de la liste, on utilise l’indiçage habituel : 


>>> zoo[1] 
['tigre', 2] 


Pour accéder à un élément de la sous-liste, on utilise un double indiçage : 


>>> zoo[1] [0] 

'tigre' 

>>> zoo[1] [1] 

2 

On verra un peu plus loin qu’il existe en Python des dictionnaires qui sont également trés pratiques pour stocker de 
lV information structurée. On verra aussi qu'il existe un module nommé NumPy qui permet de créer des listes ou des tableaux 


de nombres (vecteurs et matrices) et de les manipuler. 


4.9 Minimum, maximum et somme d’une liste 


Les fonctions min(), max() et sum() renvoient respectivement le minimum, le maximum et la somme d’une liste passée 
en argument. 

>>> liste = list (range (10)) 

>>> liste 

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


>>> sum(liste) 
45 
>>> min(liste) 
0 
>>> max(liste) 
9 


Méme si en théorie ces fonctions peuvent prendre en argument une liste de strings, on les utilisera la plupart du temps 
avec des types numériques (liste d’entiers et / ou de floats). 

Nous avions déjà croisé min (), max () dans le chapitre 2 Variables. On avait vu que ces deux fonctions pouvaient prendre 
plusieurs arguments entiers et / ou floats, par exemple : 


>>> min(3, 4) 
3 


Attention toutefois à ne pas mélanger entiers et floats d’une part avec une liste d'autre part, car cela renvoie une erreur : 
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>>> min(liste, 3, 4) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: '<' not supported between instances of 'int' and 'list' 


Soit on passe plusieurs entiers et / ou floats en argument, soit on passe une liste unique. 


4.10 Exercices 


Conseil : utilisez l’interpréteur Python. 


4.10.1 Jours de la semaine 
Constituez une liste semaine contenant les 7 jours de la semaine. 


1. À partir de cette liste, comment récupérez-vous seulement les 5 premiers jours de la semaine d’une part, et ceux du 
week-end d autre part? Utilisez pour cela l’indiçage. 


2. Cherchez un autre moyen pour arriver au même résultat (en utilisant un autre indiçage). 
3. Trouvez deux manières pour accéder au dernier jour de la semaine. 


4. Inversez les jours de la semaine en une commande. 


4.10.2 Saisons 


Créez 4 listes hiver, printemps, ete et automne contenant les mois correspondants à ces saisons. Créez ensuite une 
liste saisons contenant les listes hiver, printemps, ete et automne. Prévoyez ce que renvoient les instructions suivantes, 
puis vérifiez-le dans l’interpréteur : 


1. saisons [2] 

2. saisons [1] [0] 
3. saisons[1:2] 
4 


. saisons [:] [1]. Comment expliquez-vous ce dernier résultat ? 


4.10.3 Table de multiplication par 9 


Affichez la table de multiplication par 9 en une seule commande avec les instructions range () et list(). 


4.10.4 Nombres pairs 


Répondez à la question suivante en une seule commande. Combien y a-t-il de nombres pairs dans l’intervalle [2, 10000] 
inclus ? 
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Chapitre 5 


Boucles et comparaisons 


5.1 Boucles for 


5.1.1 Principe 


En programmation, on est souvent amené à répéter plusieurs fois une instruction. Incontournables à tout langage de pro- 
grammation, les boucles vont nous aider à réaliser cette tâche de manière compacte et efficace. 
Imaginez par exemple que vous souhaitiez afficher les éléments d’une liste les uns après les autres. Dans l’état actuel de 
vos connaissances, il faudrait taper quelque chose du style : 
animaux = ["girafe", "tigre", "singe", "souris"] 
print (animaux [0]) 
print (animaux [1]) 


print (animaux [2]) 
print (animaux [3]) 


Si votre liste ne contient que 4 éléments, ceci est encore faisable mais imaginez qu’elle en contienne 100 voire 1000! Pour 

remédier à cela, il faut utiliser les boucles. Regardez l’exemple suivant : 
>>> animaux = ["girafe", "tigre", "singe", "souris"] 
>>> for animal in animaux: 
print (animal) 
girafe 
tigre 
singe 
souris 

Commentons en détails ce qu’il s’est passé dans cet exemple : 

La variable animal est appelée variable d’itération, elle prend successivement les différentes valeurs de la liste animaux 
à chaque itération de la boucle. On verra un peu plus loin dans ce chapitre que l’on peut choisir le nom que l’on veut pour 
cette variable. Celle-ci est créée par Python la première fois que la ligne contenant le for est exécutée (si elle existait déjà son 
contenu serait écrasé). Une fois la boucle terminée, cette variable d’itération animal ne sera pas détruite et contiendra ainsi 
la dernière valeur de la liste animaux (ici la chaîne de caractères souris). 

Notez bien les types des variables utilisées ici : animaux est une liste sur laquelle on itère, et animal est une chaîne 
de caractères car chaque élément de la liste est une chaîne de caractères. Nous verrons plus loin que la variable d’itération 
peut être de n’importe quel type selon la liste parcourue. En Python, une boucle itère toujours sur un objet dit séquentiel 
(c’est-à-dire un objet constitué d’autres objets) tel qu’une liste. Nous verrons aussi plus tard d’autres objets séquentiels sur 
lesquels on peut itérer dans une boucle. 

D’ores et déjà, prétez attention au caractère deux-points « : » à la fin de la ligne débutant par for. Cela signifie que la 
boucle for attend un bloc d’instructions, en l’occurrence toutes les instructions que Python répétera à chaque itération de la 
boucle. On appelle ce bloc d’instructions le corps de la boucle. Comment indique-t-on à Python où ce bloc commence et se 
termine ? Cela est signalé uniquement par l’indentation, c’est-à-dire le décalage vers la droite de la (ou des) ligne(s) du bloc 
d'instructions. 


Remarque 
Les notions de bloc d’instruction et d’indentations avait été abordées rapidement dans le chapitre 1 Introduction. 
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Dans l’exemple suivant, le corps de la boucle contient deux instructions : print (animal) et print (animal*2) car elles 
sont indentées par rapport à la ligne débutant par for : 


for animal in animaux: 
print (animal) 
print (animal *2) 
print("C'est fini") 
La ligne 4 print ("C'est fini") ne fait pas partie du corps de la boucle car elle est au même niveau que le for (c’est- 
a-dire non indentée par rapport au for). Notez également que chaque instruction du corps de la boucle doit étre indentée de 
la même manière (ici 4 espaces). 


Remarque 
Outre une meilleure lisibilité, les deux-points et l’indentation sont formellement requis en Python. Même si on peut in- 
denter comme on veut (plusieurs espaces ou plusieurs tabulations, mais pas une combinaison des deux), les développeurs 
recommandent l’utilisation de quatre espaces. Vous pouvez consulter à ce sujet le chapitre 15 Bonnes pratiques de program- 
mation en Python. 
Faites en sorte de configurer votre éditeur de texte favori de façon à écrire quatre espaces lorsque vous tapez sur la touche 
Tab (tabulation). 


Si on oublie l’indentation, Python renvoie un message d’erreur : 


>>> for animal in animaux: 
print (animal) 
File "<stdin>", line 2 


print (animal) 

IndentationError: expected an indented block 

Dans les exemples ci-dessus, nous avons exécuté une boucle en itérant directement sur une liste. Une tranche d’une liste 
étant elle méme une liste, on peut également itérer dessus : 

>>> animaux = ["girafe", "tigre", "singe", "souris"] 

>>> for animal in animaux[1:3]: 

print (animal) 

tigre 

singe 

On a vu que les boucles for pouvaient utiliser une liste contenant des chaines de caractéres, mais elles peuvent tout aussi 
bien utiliser des listes contenant des entiers (ou n’importe quel type de variable). 


>>> for i in [t, 2, 31: 
print (i) 


ON. + 


5.1.2 Fonction range () 
Python posséde la fonction range() que nous avons rencontrée précédemment dans le chapitre 4 sur les Listes et qui est 
aussi bien commode pour faire une boucle sur une liste d’entiers de manière automatique : 


>>> for i in range (4): 
print (i) 


WNrFRO- - 


Dans cet exemple, nous pouvons faire plusieurs remarques importantes : 

Contrairement à la création de liste avec list (range (4) ), la fonction range () peut être utilisée telle quelle dans une 
boucle. Il n’est pas nécessaire de taper for i in list (range (4)): même si cela fonctionnerait également. 

Comment cela est-ce possible? Et bien range() est une fonction qui a été spécialement conçue pour cela!, c’est-à- 
dire que l’on peut itérer directement dessus. Pour Python, il s’agit d’un nouveau type, par exemple dans l'instruction x = 


1. https://docs.python.org/fr/3/library/stdtypes.html#typesseq-range 
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range (3) la variable x est de type range (tout comme on avait les types int, float, str ou list) à utiliser spécialement avec les 
boucles. 

L'instruction list (range (4) ) se contente de transformer un objet de type range en un objet de type list. Si vous vous 
souvenez bien, il s’agit d’une fonction de casting, qui convertit un type en un autre (voir chapitre 2 Variables). Il n’y au- 
cun intérêt à utiliser dans une boucle la construction for i in list(range(4)):. C'est même contre-productif. En effet, 
range () se contente de stocker l’entier actuel, le pas pour passer à l’entier suivant, et le dernier entier à parcourir, ce qui re- 
vient à stocker seulement 3 nombres entiers et ce quelle que soit la longueur de la séquence, même avec un range (1000000). 
Si on utilisait List (range (1000000) ), Python construirait d’abord une liste de 1 million d’éléments dans la mémoire puis 
itérerait dessus, d’où une énorme perte de temps! 


5.1.3 Nommage de la variable d’itération 


Dans l’ exemple précédent, nous avons choisi le nom i pour la variable d'itération. Ceci est une habitude en informatique et 
indique en général qu'il s’agit d’un entier (le nom i vient sans doute du mot indice ou index en anglais). Nous vous conseillons 
de suivre cette convention afin d’éviter les confusions, si vous itérez sur les indices vous pouvez appeler la variable d’itération 
i (par exemple dans for i in range(4):). 

Si, par contre, vous itérez sur une liste comportant des chaînes de caractères, mettez un nom explicite pour la variable 
d'itération. Par exemple : 

for prenom in ["Joe", "Bill", "John"]: 


5.14 Itération sur les indices 


Revenons 4 notre liste animaux. Nous allons maintenant parcourir cette liste, mais cette fois par une itération sur ses 
indices : 


>>> animaux = ["girafe", "tigre", "singe", "souris"] 
>>> for i in range(4): 
print (animaux [i]) 
girafe 
tigre 
singe 
souris 


La variable i prendra les valeurs successives 0, 1, 2 et 3 et on accédera à chaque élément de la liste animaux par son 
indice (i.e. animaux [i] ). Notez à nouveau le nom i de la variable d’itération car on itére sur les indices. 
Quand utiliser l’une ou l’autre des 2 méthodes ? La plus efficace est celle qui réalise les itérations directement sur les 


éléments : 
>>> animaux = ["girafe", "tigre", "singe", "souris"] 
>>> for animal in animaux: 
print (animal) 
girafe 
tigre 
singe 
souris 


Toutefois, il se peut qu’au cours d’une boucle vous ayez besoin des indices, auquel cas vous devrez itérer sur les indices : 


>>> animaux = ["girafe", "tigre", "singe", "souris"] 
>>> for i in range(len(animaux)): 
print(f"L'animal {i} est un(e) fanimaux[i]}") 


L'animal 
L'animal 
L'animal 
L'animal 


est un(e) girafe 
est un(e) tigre 
est un(e) singe 
est un(e) souris 


w N RH © 


Python possède toutefois la fonction enumerate() qui vous permet d’itérer sur les indices et les éléments eux-mêmes. 


>>> animaux = ["girafe", "tigre", "singe", "souris"] 
>>> for i, animal in enumerate(animaux): 
print(f"L'animal {i} est un(e) fanimaux[i]}") 


L'animal 
L'animal 
L'animal 
L'animal 


est un(e) girafe 
est un(e) tigre 
est un(e) singe 
est un(e) souris 


WNrRO 
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5.2 Comparaisons 


Avant de passer á une autre sorte de boucles (les boucles while), nous abordons tout de suite les comparaisons. Celles-ci 
seront reprises dans le chapitre 6 sur les Tests. 
Python est capable d’effectuer toute une série de comparaisons entre le contenu de deux variables, telles que : 


Syntaxe Python Signification 


== égal à 

I= différent de 

> supérieur a 

>= supérieur ou égal a 
< inférieur a 

<= inférieur ou égal a 


Python renvoie la valeur True si la comparaison est vraie et False si elle est fausse. True et False sont des booléens (un 
nouveau type de variable). 

Faites bien attention à ne pas confondre l’opérateur d’affectation = qui affecte une valeur à une variable et l’opérateur 
de comparaison == qui compare les valeurs de deux variables. 

Vous pouvez également effectuer des comparaisons sur des chaînes de caractères. 


>>> animal = "tigre" 
>>> animal == "tig" 
False 

>>> animal != "tig" 
True 

>>> animal == "tigre" 
True 


Dans le cas des chaines de caractéres, a priori seuls les tests == et != ont un sens. En fait, on peut aussi utiliser les 
opérateurs <, >, <= et >=. Dans ce cas, l’ordre alphabétique est pris en compte, par exemple : 


>>> la" < "p" 
True 


` 


"a" est inférieur à "b" car le caractère a est situé avant le caractère b dans l’ordre alphabétique. En fait, c’est l’ordre 
ASCII? des caractères qui est pris en compte (à chaque caractère correspond un code numérique), on peut donc aussi comparer 
des caractères spéciaux (comme # ou ~) entre eux. Enfin, on peut comparer des chaînes de caractères de plusieurs caractères : 


>>> "ali" < "alo" 
True 
>>> "abb" < "ada" 
True 


Dans ce cas, Python compare les deux chaînes de caractères, caractère par caractère, de la gauche vers la droite (le premier 
caractère avec le premier, le deuxième avec le deuxième, etc). Dès qu’un caractère est différent entre l’une et l’autre des deux 
chaînes, il considère que la chaîne la plus petite est celle qui présente le caractère ayant le plus petit code ASCII (les caractères 
suivants de la chaîne de caractères sont ignorés dans la comparaison), comme dans l’exemple "abb" < "ada" ci-dessus. 


5.3 Boucles while 


Une autre alternative à l'instruction for couramment utilisée en informatique est la boucle while. Le principe est simple. 
Une série d’instructions est exécutée tant qu’une condition est vraie. Par exemple : 


2. http://fr.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange 
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>>> i= 1 

>>> while i <= 4: 
ee print (i) 
A is i t f 
1 

2 

3 

4 


Remarquez qu’il est encore une fois nécessaire d’indenter le bloc d’instructions correspondant au corps de la boucle (ici, 
les instructions lignes 3 et 4). 
Une boucle while nécessite généralement trois éléments pour fonctionner correctement : 


1. Initialisation de la variable d’itération avant la boucle (ligne 1). 
2. Test de la variable d’itération associée à l’instruction while (ligne 2). 


3. Mise à jour de la variable d’itération dans le corps de la boucle (ligne 4). 


Faites bien attention aux tests et à l’incrémentation que vous utilisez car une erreur mène souvent à des « boucles infinies 
» qui ne s’arrêtent jamais. Vous pouvez néanmoins toujours stopper l’exécution d’un script Python à l’aide de la combinaison 
de touches Ctrl-C (c’est-à-dire en pressant simultanément les touches Ctrl et C). Par exemple : 
i = 0 
while i < 10: 
print("Le python c'est cool !") 


Ici, nous avons omis de mettre à jour la variable i dans le corps de la boucle. Par conséquent, la boucle ne s’ arrétera jamais 
(sauf en pressant Ctrl-C) puisque la condition i < 10 sera toujours vraie. 


La boucle while combinée à la fonction input () peut s’avérer commode lorsqu’on souhaite demander à l’utilisateur une 
valeur numérique. Par exemple : 


>>> i = 0 

>>> while i < 10: 
reponse = input ("Entrez un entier supérieur à 10 : ") 
i = int (reponse) 

Entrez un entier supérieur à 10 : 4 

Entrez un entier supérieur à 10 : -3 

Entrez un entier supérieur à 10 : 15 

>>> i 

15 


La fonction input () prend en argument un message (sous la forme d’une chaîne de caractères), demande à l’utilisateur 
d’entrer une valeur et renvoie celle-ci sous forme d’une chaîne de caractères. Il faut ensuite convertir cette dernière en entier 
(avec la fonction int ()). 


5.4 Exercices 


Conseil : pour ces exercices, créez des scripts puis exécutez-les dans un shell. 


5.4.1 Boucles de base 

Soit la liste ["Vache", "souris", "levure", "bacterie"]. Affichez l’ensemble des éléments de cette liste (un 
élément par ligne) de trois maniéres différentes (deux avec for et une avec while). 
5.4.2 Boucle et jours de la semaine 


Constituez une liste semaine contenant les 7 jours de la semaine. 
Écrivez une série d’ instructions affichant les jours de la semaine (en utilisant une boucle for), ainsi qu’une autre série 
d'instructions affichant les jours du week-end (en utilisant une boucle while). 


5.4.3 Nombres de 1 à 10 sur une ligne 


Avec une boucle, affichez les nombres de 1 à 10 sur une seule ligne. 
Conseil : n’hésitez pas à relire le début du chapitre 3 Affichage qui discute de la fonction print O. 
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5.4.4 Nombres pairs et impairs 


Soit impairs la liste de nombres [1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21]. Ecrivez un programme qui, a partir 
de la liste impairs, construit une liste pairs dans laquelle tous les éléments de impairs sont incrémentés de 1. 


5.4.5 Calcul de la moyenne 


Voici les notes d’un étudiant [14, 9, 6, 8, 12]. Calculez la moyenne de ces notes. Utilisez l’écriture formatée pour 
afficher la valeur de la moyenne avec deux décimales. 


5.4.6 Produit de nombres consécutifs 


Avez les fonctions list () et range (), créez la liste entiers contenant les nombres entiers pairs de 2 à 20 inclus. 
Calculez ensuite le produit des nombres consécutifs deux à deux de entiers en utilisant une boucle. Exemple pour les 
premiéres itérations : 


8 
24 
48 


Fed 


5.4.7 Triangle 


Créez un script qui dessine un triangle comme celui-ci : 


* 
xk 

xk k 

k k k k 

k k k k kK 
OOK K kK kK K 

aK K k kK K k K 

2K K kK kK K kK kK K 
OO kK K K K K K K 
aK K kK K kK K K K K K 


5.4.8 Triangle inversé 


Créez un script qui dessine un triangle comme celui-ci : 


aK K k K kK K kK K K K 
OO kK K K K K K K 
2K K kK kK K KKK 

ak K kK kK K K K 
OOK kK kK K K 

k k k k k 

k k k k 

xk k 

xk 

* 


5.4.9 Triangle gauche 


Créez un script qui dessine un triangle comme celui-ci : 


* 
kk 

xk k 

k k kK kK 

k k kK k k 
EEES 

K k K kK OK KOK 

aK K k K k kK K K 

Ok K kK K K K K K K 
aK K k K kK K K K K K 
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colonnes 


1 2 


lignes 


FIGURE 5.1 — Parcours d’une matrice. 


5.4.10 Pyramide 


Créez un script pyra. py qui dessine une pyramide comme celle-ci : 


* 
x kk 
k k k k k 
aK K k K OK kK K 
aK K kK k kK K OK K K 
aK K k kK k kK ək K K K K 
OK K k k kK K kK K K K K K K 
aK K k ək ək ək kK K k K OK K k K K 
aK kK ək ək ək ək ək ək K ək K K K K K K K 
aK kK ək kK ək kK ək ək ək ək K K kK K ək K K K K 


Essayez de faire évoluer votre script pour dessiner la pyramide à partir d’un nombre arbitraire de lignes N. Vous pourrez 
demander à l’utilisateur le nombre de lignes de la pyramide avec les instructions suivantes qui utilisent la fonction input () : 


reponse = input ("Entrez un nombre de lignes (entier positif): ") 
N = int(reponse) 


54.11 Parcours de matrice 


Imaginons que l’on souhaite parcourir tous les éléments d’une matrice carrée, c’est-à-dire d’une matrice qui est constituée 
d’autant de lignes que de colonnes. 

Créez un script qui parcourt chaque élément de la matrice et qui affiche le numéro de ligne et de colonne uniquement avec 
des boucles for. 

Pour une matrice 2 x 2, le schéma de la figure 5.1 vous indique comment parcourir une telle matrice. L'affichage attendu 
est : 


ligne colonne 
1 


Nhe Ne 


1 
2 
2 


Attention à bien respecter l'alignement des chiffres qui doit être justifié à droite sur 4 caractères. Testez pour une matrice 
3 x 3, puis 5 x 5, et enfin 10 x 10. 
Créez une seconde version de votre script, cette fois-ci avec deux boucles while. 


5.4.12 Parcours de demi-matrice sans la diagonale (exercice ++) 


En se basant sur le script précédent, on souhaite réaliser le parcours d’une demi-matrice carrée sans la diagonale. On peut 
noter que cela produit tous les couples possibles une seule fois (1 et 2 est équivalent à 2 et 1), en excluant par ailleurs chaque 
élément avec lui même (1 et 1, 2 et 2, etc). Pour mieux comprendre ce qui est demandé, la figure 5.2 indique les cases à 
parcourir en gris : 

Créez un script qui affiche le numéro de ligne et de colonne, puis la taille de la matrice N x N et le nombre total de cases 
parcourues. Par exemple pour une matrice 4 x 4 (N=4) : 
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FIGURE 5.2 — Demi-matrice sans la diagonale (en gris). 


départ arrivée 


+--+ M 
101234567 


FIGURE 5.3 — Sauts de puce. 


ligne colonne 


wyer 
HS HS © BB wWN 


Pour une matrice 4x4, on a parcouru 6 cases 


Testez votre script avec N=3, puis N=4 et enfin N=5. 

Concevez une seconde version à partir du script précédent, où cette fois on n’affiche plus tous les couples possibles mais 
simplement la valeur de N, et le nombre de cases parcourues. Affichez cela pour des valeurs de N allant de 2 à 10. 

Pouvez-vous trouver une formule générale reliant le nombre de cases parcourues à N? 


5.4.13 Sauts de puce 


On imagine une puce qui se déplace aléatoirement sur une ligne, en avant ou en arrière, par pas de 1 ou -1. Par exemple, 
si elle est à l’emplacement 0, elle peut sauter à l’emplacement 1 ou -1; si elle est à emplacement 2, elle peut sauter à 
l'emplacement 3 ou 1, etc. 

Avec une boucle while, simuler le mouvement de cette puce de l’emplacement initial O à l’emplacement final 5 (voir le 
schéma de la figure 5.3). Combien de sauts sont nécessaires pour réaliser ce parcours ? Relancez plusieurs fois le programme. 
Trouvez-vous le même nombre de sauts à chaque exécution ? 

Conseil : vous utiliserez l'instruction random.choice([-1,1]) qui renvoie au hasard les valeurs -1 ou 1 avec la même 
probabilité. Avant d’utiliser cette instruction vous mettrez au tout début de votre script la ligne 
import random 
Nous reverrons la signification de cette syntaxe particulière dans le chapitre 8 Modules. 


5.4.14 Suite de Fibonacci (exercice +++) 


La suite de Fibonacci? est une suite mathématique qui porte le nom de Leonardo Fibonacci, un mathématicien italien 
du XIII? siècle. Initialement, cette suite a été conçue pour décrire la croissance d’une population de lapins, mais elle peut 


3. https://fr.wikipedia.org/wiki/Suite_ de Fibonacci 
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également être utilisée pour décrire certains motifs géométriques retrouvés dans la nature (coquillages, fleurs de tournesol. ..). 

Pour la suite de Fibonacci (x,), le terme au rang n (avec n > 1) est la somme des nombres aux rangs n— 1 etn—2: 

Xn = Xn-1 + Xn-2 

Par définition, les deux premiers termes sont xy = 0 et xı = 1. 

A titre d’exemple, les 10 premiers termes de la suite de Fibonacci sont donc 0, 1, 1, 2, 3, 5, 8, 13, 21 et 34. 

Créez un script qui construit une liste fibo avec les 15 premiers termes de la suite de Fibonacci puis |’ affiche. 

Améliorez ce script en affichant, pour chaque élément de la liste fibo avec n > 1, le rapport entre l’élément de rang n et 
P élément de rang n — 1. Ce rapport tend-il vers une constante ? Si oui, laquelle ? 
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Tests 


6.1 Définition 


Les tests sont un élément essentiel à tout langage informatique si on veut lui donner un peu de complexité car ils permettent 
à l’ordinateur de prendre des décisions. Pour cela, Python utilise l’instruction if ainsi qu’une comparaison que nous avons 
abordée au chapitre précédent. Voici un premier exemple : 


= 2 
print ("Le test est vrai !") 


Le test est vrai ! 


et un second : 


>>> x = "souris" 
>>> if x == "tigre": 
print ("Le test est vrai !") 


Il y a plusieurs remarques à faire concernant ces deux exemples : 

— Dans le premier exemple, le test étant vrai, l'instruction print("Le test est vrai !") est exécutée. Dans le 
second exemple, le test est faux et rien n’est affiché. 

— Les blocs d'instructions dans les tests doivent forcément être indentés comme pour les boucles for et while. Dinden- 
tation indique la portée des instructions à exécuter si le test est vrai. 

— Comme avec les boucles for et while, la ligne qui contient l'instruction if se termine par le caractère deux-points « 


co» 


6.2 Tests à plusieurs cas 


Parfois, il est pratique de tester si la condition est vraie ou si elle est fausse dans une même instruction if. Plutôt que 
d'utiliser deux instructions if, on peut se servir des instructions if et else: 


>>> x = 2 
>>> if x == 2: 
print("Le test est vrai !") 
else: 


print("Le test est faux !") 


Le test est vrai ! 


>>> x = 3 
>>> if x == 2: 
print("Le test est vrai !") 
else: 


print("Le test est faux !") 


Le test est faux ! 


On peut utiliser une série de tests dans la méme instruction if, notamment pour tester plusieurs valeurs d’une méme 
variable. 
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Par exemple, on se propose de tirer au sort une base d’ ADN puis d’afficher le nom de cette dernière. Dans le code suivant, 
nous utilisons l’instruction random.choice(liste) qui renvoie un élément choisi au hasard dans une liste. L’instruction 
import random sera vue plus tard dans le chapitre 8 Modules, admettez pour le moment qu’elle est nécessaire. 


>>> import random 


>>> base = random.choice(["a", "t", "c", "g"]) 
>>> if base == "a": 
print ("choix d'une adénine") 
elif base == "t": 
print ("choix d'une thymine") 
elif base == "c": 
print ("choix d'une cytosine") 
elif base == "g": 


print ("choix d'une guanine") 
choix d'une cytosine 


Dans cet exemple, Python teste la premiére condition, puis, si et seulement si elle est fausse, teste la deuxiéme et ainsi de 
suite... Le code correspondant à la première condition vérifiée est exécuté puis Python sort du bloc d’ instructions du if. 


6.3 Importance de l’indentation 


De nouveau, faites bien attention à l'indentation ! Vous devez être très rigoureux sur ce point. Pour vous en convaincre, 
exécutez ces deux exemples de code : 
Code 1 


nombres = [4, 5, 6] 
for nb in nombres: 
if nb == 5: 
print("Le test est vrai") 
print(f"car la variable nb vaut {nb}") 


Résultat : 


Le test est vrai 
car la variable nb vaut 5 


Code 2 


nombres = [4, 5, 6] 
for nb in nombres: 
if nb == 5: 
print("Le test est vrai") 
print(f"car la variable nb vaut {nb}") 


Résultat : 


car la variable nb vaut 4 

Le test est vrai 

car la variable nb vaut 5 

car la variable nb vaut 6 

Les deux codes pourtant très similaires produisent des résultats très différents. Si vous observez avec attention l’indentation 

des instructions sur la ligne 5, vous remarquerez que dans le code 1, l’instruction est indentée deux fois, ce qui signifie qu’elle 
appartient au bloc d’instructions du test if. Dans le code 2, l’instruction de la ligne 5 n’est indentée qu’une seule fois, ce 
qui fait qu’elle n’appartient plus au bloc d’instructions du test if, d’où l’affichage de car la variable nb vaut xx pour 
toutes les valeurs de nb. 


6.4 Tests multiples 


Les tests multiples permettent de tester plusieurs conditions en même temps en utilisant des opérateurs booléens. Les deux 
opérateurs les plus couramment utilisés sont le OU et le ET. Voici un petit rappel sur le fonctionnement de l’opérateur OU : 


Condition 1 Opérateur Condition 2 Résultat 


Vrai OU Vrai Vrai 
Vrai OU Faux Vrai 
Faux OU Vrai Vrai 
Faux OU Faux Faux 
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et de l’opérateur ET : 


Condition 1 Opérateur Condition 2 Résultat 


Vrai ET Vrai Vrai 
Vrai ET Faux Faux 
Faux ET Vrai Faux 
Faux ET Faux Faux 


En Python, on utilise le mot réservé and pour l’opérateur ET et le mot réservé or pour l’opérateur OU. Respectez bien la 
casse des opérateurs and et or qui, en Python, s’écrivent en minuscule. En voici un exemple d’utilisation : 


"ou 
NN 


>>> y 
>>> if x == 2 and y == 2: 
print("le test est vrai") 


le test est vrai 


Notez que le méme résultat serait obtenu en utilisant deux instructions if imbriquées : 


>>> x = 2 
>>> = 2 
>>> if x == 2: 
. if == 2: 


print("le test est vrai") 


le test est vrai 


Vous pouvez aussi tester directement l’effet de ces opérateurs à l’aide de True et False (attention à respecter la casse). 


>>> True or False 
True 


Enfin, on peut utiliser l’opérateur logique de négation not qui inverse le résultat d’une condition : 


>>> not True 

False 

>>> not False 

True 

>>> not (True and True) 
False 


6.5 Instructions break et continue 


Ces deux instructions permettent de modifier le comportement d’une boucle (for ou while) avec un test. 
L'instruction break stoppe la boucle. 


>>> for i in range (5): 

Tf i > 2? 
break 

print(i) 


NRO. + 


L'instruction continue saute à l’itération suivante, sans exécuter la suite du bloc d'instructions de la boucle. 


>>> for i in range(5): 
if i == 2: 

continue 
print (i) 


BRWRO- 
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6.6 Tests de valeur sur des floats 


Lorsque l’on souhaite tester la valeur d’une variable de type float, le premier réflexe serait d’utiliser l’opérateur d’égalité 
comme : 


>>> 1/10 == 0.1 
True 


Toutefois, nous vous le déconseillons formellement. Pourquoi? Python stocke les valeurs numériques des floats sous forme 
de nombres flottants (d’où leur nom !), et cela mène à certaines limitations !. Observez l’exemple suivant : 
>>> (3 - 2.7) == 0.3 
False 


>>> 3 - 2.7 
0.2999999999999998 


Nous voyons que le résultat de l’opération 3 - 2.7 n’est pas exactement 0.3 d’où le False en ligne 2. 
En fait, ce problème ne vient pas de Python, mais plutôt de la manière dont un ordinateur traite les nombres flottants 
(comme un rapport de nombres binaires). Ainsi certaines valeurs de float ne peuvent être qu'approchées. Une manière de s’en 


rendre compte est d’utiliser l’écriture formatée en demandant l’affichage d’un grand nombre de décimales : 
>>> 0.3 
0.3 
>>> f"{0.3:.5f}" 
'0.30000' 


>>> f"{0.3:.60f}" 
'0.299999999999999988897769753748434595763683319091796875000000 ' 


>>> £"{3 - 2.7:.60f}" 
"0.299999999999999822364316059974953532218933105468750000000000 ' 


On observe que lorsqu’on tape 0.3, Python affiche une valeur arrondie. En réalité, le nombre réel 0.3 ne peut être 
qu’ approché lorsqu'on le code en nombre flottant. Il est donc essentiel d’avoir cela en tête lorsque l’on effectue un test. 


Conseil 

Pour les raisons évoquées ci-dessus, il ne faut surtout pas tester si un float est égal à une certaine valeur. La bonne pratique 
est de vérifier si un float est compris dans un intervalle avec une certaine précision. Si on appelle cette précision delta, on peut 
procéder ainsi : 


01 
>>> var 2:1 
>>> 0.3 < v 
True 
>>> abs(var - 0.3) < delta 


True 


>>> delta 00 
= a 


= 0. 
3.0 
delt ar < 0.3 + delta 


Ici on teste si var est compris dans l’intervalle 0.3 + delta. Les deux méthodes mènent à un résultat strictement équivalent : 
— La ligne 3 est intuitive car elle ressemble à un encadrement mathématique. 
— La ligne 5 utilise la fonction valeur absolue abs () et est plus compacte. 


6.7 Exercices 


Conseil : pour ces exercices, créez des scripts puis exécutez-les dans un shell. 


6.7.1 Jours de la semaine 


Constituez une liste semaine contenant le nom des sept jours de la semaine. 

En utilisant une boucle, écrivez chaque jour de la semaine ainsi que les messages suivants : 

— Au travail s’il s’agit du lundi au jeudi; 

— Chouette c'est vendredi s’il s’agit du vendredi; 

— Repos ce week-end s’il s’agit du samedi ou du dimanche. 

Ces messages ne sont que des suggestions, vous pouvez laisser libre cours 4 votre imagination. 


1. https://docs.python. org/fr/3/tutorial/floatingpoint .html 
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6.7.2 Séquence complémentaire d’un brin d’ADN 


La liste ci-dessous représente la séquence d’un brin d ADN : 

CUA", "OE NGM "T; LE RUES "A", NGM NGM pH WA", WAM ME ng") 

Créez un script qui transforme cette séquence en sa séquence complémentaire. 

Rappel : la séquence complémentaire s’ obtient en remplaçant A par T, T par A, C par G et G par C. 


6.7.3 Minimum d’une liste 


La fonction min() de Python renvoie l’élément le plus petit d’une liste constituée de valeurs numériques ou de chaînes de 
caractères. Sans utiliser cette fonction, créez un script qui détermine le plus petit élément de la liste [8, 4, 6, 1, 5]. 


6.7.4 Fréquence des acides aminés 


La liste ci-dessous représente une séquence d’acides aminés : 
[rar ; "R" : wat ; "y" ; "y" ; "gr , "y" ; "gu 3 "rg" ; "y" 5 "W" ; "R" > wa ; ugua 
Calculez la fréquence des acides aminés alanine (A), arginine (R), tryptophane (W) et glycine (G) dans cette séquence. 


6.7.5 Notes et mention d’un étudiant 


Voici les notes d’un étudiant : 14, 9, 13, 15 et 12. Créez un script qui affiche la note maximum (utilisez la fonction max()), 
la note minimum (utilisez la fonction min()) et qui calcule la moyenne. 

Affichez la valeur de la moyenne avec deux décimales. Affichez aussi la mention obtenue sachant que la mention est « 
passable » si la moyenne est entre 10 inclus et 12 exclus, « assez bien » entre 12 inclus et 14 exclus et « bien » au-delà de 14. 


6.7.6 Nombres pairs 


Construisez une boucle qui parcourt les nombres de 0 à 20 et qui affiche les nombres pairs inférieurs ou égaux à 10 d’une 
part, et les nombres impairs strictement supérieurs à 10 d’autre part. 
Pour cet exercice, vous pourrez utiliser l’opérateur modulo % qui renvoie le reste de la division entière entre deux nombres 
et dont voici quelques exemples d’utilisation : 
>>> 4% 3 
1 
>>> 5 % 3 
2 
>>> 4% 2 
0 
>>> 5 % 2 
1 
>>> 6 % 2 
0 
>>> 7% 2 
1 


Vous remarquerez qu’un nombre est pair lorsque le reste de sa division entière par 2 est nul. 


6.7.7 Conjecture de Syracuse (exercice +++) 


La conjecture de Syracuse? est une conjecture mathématique qui reste improuvée à ce jour et qui est définie de la manière 
suivante. 

Soit un entier positif n. Si n est pair, alors le diviser par 2. Si il est impair, alors le multiplier par 3 et lui ajouter 1. En 
répétant cette procédure, la suite de nombres atteint la valeur 1 puis se prolonge indéfiniment par une suite de trois valeurs 
triviales appelée cycle trivial. 

Jusqu’a présent, la conjecture de Syracuse, selon laquelle depuis n’importe quel entier positif la suite de Syracuse atteint 
1, n’a pas été mise en défaut. 

Par exemple, les premiers éléments de la suite de Syracuse si on prend comme point de départ 10 sont : 10, 5, 16, 8, 4, 2, 


2. http://fr.wikipedia.org/wiki/Conjecture_de_ Syracuse 
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Créez un script qui, partant d’un entier positif n (par exemple 10 ou 20), crée une liste des nombres de la suite de Syracuse. 
Avec différents points de départ (c’est-à-dire avec différentes valeurs de n), la conjecture de Syracuse est-elle toujours vérifiée ? 
Quels sont les nombres qui constituent le cycle trivial? 


Remarque 


1. Pour cet exercice, vous avez besoin de faire un nombre d’itérations inconnu pour que la suite de Syracuse atteigne 
le chiffre 1 puis entame son cycle trivial. Vous pourrez tester votre algorithme avec un nombre arbitraire d'itérations, 
typiquement 20 ou 100, suivant votre nombre n de départ. 


2. Un nombre est pair lorsque le reste de sa division entière (opérateur modulo %) par 2 est nul. 


6.7.8 Attribution de la structure secondaire des acides aminés d’une protéine (exercice +++) 


Dans une protéine, les différents acides aminés sont liés entre eux par une liaison peptidique. Les angles phi et psi sont 
deux angles mesurés autour de cette liaison peptidique. Leurs valeurs sont utiles pour définir la conformation spatiale (appelée 
« structure secondaire ») adoptée par les acides aminés. 

Par exemples, les angles phi et psi d’une conformation en « hélice alpha » parfaite ont une valeur de -57 degrés et -47 
degrés respectivement. Bien sûr, il est très rare que l’on trouve ces valeurs parfaites dans une protéine, et il est habituel de 
tolérer une déviation de + 30 degrés autour des valeurs idéales de ces angles. 

Vous trouverez ci-dessous une liste de listes contenant les valeurs des angles phi et psi de 15 acides aminés de la protéine 
ITFE? : 


[[48.6, 53.4],[-124.9, 156.7],[-66.2, -30.8], \ 
[-58.8, -43.1],[-73.9, -40.6],[-53.7, -37.5], \ 
[-80.6, -26.0],[-68.5, 135.0],[-64.9, -23.5], \ 
[-66.9, -45.5],[-69.6, -41.0],[-62.7, -37.5], \ 
[-68.2, -38.3],[-61.2, -49.1],[-59.7, -41.1]] 


Pour le premier acide aminé, l’angle phi vaut 48.6 et l’angle psi 53.4. Pour le deuxième, l’angle phi vaut -/24.9 et langle 
psi 156.7, etc. 

En utilisant cette liste, créez un script qui teste, pour chaque acide aminé, s’il est ou non en hélice et affiche les valeurs des 
angles phi et psi et le message adapté est en hélice ou n’est pas en hélice. 

Par exemple, pour les 3 premiers acides aminés : 

[48.6, 53.4] n'est pas en hélice 


[-124.9, 156.7] n'est pas en hélice 
[-66.2, -30.8] est en hélice 


D’après vous, quelle est la structure secondaire majoritaire de ces 15 acides aminés ? 


Remarque 


Pour en savoir plus sur le monde merveilleux des protéines, n’hésitez pas a consulter la page Wikipedia sur la structure 


secondaire des protéines *. 


6.7.9 Détermination des nombres premiers inférieurs à 100 (exercice +++) 


Voici un extrait de l’article sur les nombres premiers tiré de l’encyclopédie en ligne wikipédia 5. 

Un nombre premier est un entier naturel qui admet exactement deux diviseurs distincts entiers et positifs (qui sont alors 1 
et lui-même). Cette définition exclut 1, qui n’a qu’un seul diviseur entier positif. Par opposition, un nombre non nul produit 
de deux nombres entiers différents de 1 est dit composé. Par exemple 6 = 2 x 3 est composé, tout comme 21 = 3 x 7, mais 11 
est premier car 1 et 11 sont les seuls diviseurs de 11. Les nombres 0 et 1 ne sont ni premiers ni composés. 

Déterminez les nombres premiers inférieurs à 100. Combien y a-t-il de nombres premiers entre O et 100? Pour vous aider, 
nous vous proposons plusieurs méthodes. 


3. https://www.rcsb.org/structure/1TFE 
4. https://fr.wikipedia.org/wiki/Structure_des_prot/C3/A9inesttAngles_di/C3/A8dres_et_structure_secondaire 
5. http://fr.wikipedia.org/wiki/Nombre_premier 
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Méthode 1 (peu optimale mais assez intuitive) 


Pour chaque nombre de 2 à 100, calculez le reste de la division entière (avec l’opérateur modulo %) depuis 1 jusqu’à 
lui-même. Si c’est un nombre premier, il aura exactement deux nombres pour lesquels le reste de la division entière est égal à 
0 (1 et lui-même). Si ce n’est pas un nombre premier, il aura plus de deux nombres pour lesquels le reste de la division entière 
est égal à 0. 


Méthode 2 (plus optimale et plus rapide, mais un peu plus compliquée) 


Parcourez tous les nombres de 2 à 100 et vérifiez si ceux-ci sont composés, c’est-à-dire qu’ils sont le produit de deux 
nombres premiers. Pratiquement, cela consiste à vérifier que le reste de la division entière (opérateur modulo %) entre le 
nombre considéré et chaque nombre premier déterminé jusqu’à maintenant est nul. Le cas échéant, ce nombre n’est pas 
premier. Attention, pour cette méthode, il faudra initialiser la liste de nombres premiers avec le premier nombre premier (donc 
2). 


6.7.10 Recherche d’un nombre par dichotomie (exercice +++) 


La recherche par dichotomie © est une méthode qui consiste à diviser (en général en parties égales) un problème pour en 
trouver la solution. À titre d'exemple, voici une discussion entre Pierre et Patrick dans laquelle Pierre essaie de deviner le 
nombre (compris entre 1 et 100 inclus) auquel Patrick a pensé. 

— [Patrick] « C’est bon, j'ai pensé à un nombre entre 1 et 100. » 

Pierre] « OK, je vais essayer de le deviner. Est-ce que ton nombre est plus petit ou plus grand que 50? » 
Patrick] « Plus grand. » 

Pierre] « Est-ce que ton nombre est plus petit, plus grand ou égal a 75? » 
Patrick] « Plus grand. » 

Pierre] « Est-ce que ton nombre est plus petit, plus grand ou égal à 87? » 
Patrick] « Plus petit. » 

Pierre] « Est-ce que ton nombre est plus petit, plus grand ou égal à 81 ? » 
Patrick] « Plus petit. » 

Pierre] « Est-ce que ton nombre est plus petit, plus grand ou égal à 78 ? » 
Patrick] « Plus grand. » 

Pierre] « Est-ce que ton nombre est plus petit, plus grand ou égal à 79? » 

— [Patrick] « Égal. C’est le nombre auquel j’avais pensé. Bravo! » 

Pour arriver rapidement à deviner le nombre, l’astuce consiste à prendre à chaque fois la moitié de l’intervalle dans lequel 
se trouve le nombre. Voici le détail des différentes étapes : 


[ 
[ 
[ 
[ 
[ 
[ 
[ 
[ 
[ 
[ 
[ 
[ 


1. le nombre se trouve entre 1 et 100, on propose 50 (100 / 2). 

le nombre se trouve entre 50 et 100, on propose 75 ( 50 + (100-50)/2 ). 
le nombre se trouve entre 75 et 100, on propose 87 ( 75 + (100-75)/2 ). 
le nombre se trouve entre 75 et 87, on propose 81 ( 75 + (87-75)/2 ). 
le nombre se trouve entre 75 et 81, on propose 78 ( 75 + (81-75)/2 ). 


DN ¡Ye LP ©: D 


le nombre se trouve entre 78 et 81, on propose 79 ( 78 + (81-78)/2 ). 


Créez un script qui reproduit ce jeu de devinettes. Vous pensez à un nombre entre 1 et 100 et l’ordinateur essaie de le 
deviner par dichotomie en vous posant des questions. 
Votre programme utilisera la fonction input () pour interagir avec l’utilisateur. Voici un exemple de son fonctionnement : 


>>> lettre = input ("Entrez une lettre : ") 
Entrez une lettre : P 


>>> print(lettre) 
P 


Pour vous guider, voici ce que donnerait le programme avec la conversation précédente : 


Pensez à un nombre entre 1 et 100. 


Est-ce votre nombre est plus grand, plus petit ou égal à 50 ? [+/-/=] + 
Est-ce votre nombre est plus grand, plus petit ou égal à 75 ? [+/-/=] + 
Est-ce votre nombre est plus grand, plus petit ou égal a 87 ? [+/-/=] - 
Est-ce votre nombre est plus grand, plus petit ou égal a 81 ? [+/-/=] 


6. https://fr.wikipedia.org/wiki/Dichotomie 
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Est-ce votre nombre est plus grand, plus petit ou égal à 78 ? [+/-/=] + 
Est-ce votre nombre est plus grand, plus petit ou égal à 79 ? [+/-/=] = 
J'ai trouvé en 6 questions ! 

Les caractères [+/-/=] indiquent à Putilisateur comment il doit interagir avec l’ordinateur, c’est-à-dire entrer soit le 
caractère + si le nombre choisi est plus grand que le nombre proposé par l’ordinateur, soit le caractère - si le nombre choisi 
est plus petit que le nombre proposé par l’ordinateur, soit le caractère = si le nombre choisi est celui proposé par l’ordinateur 
(en appuyant ensuite sur la touche Entrée). 
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Chapitre 7 


Fichiers 


7.1 Lecture dans un fichier 


Une grande partie de l’information en biologie est stockée sous forme de texte dans des fichiers. Pour traiter cette infor- 
mation, vous devez le plus souvent lire ou écrire dans un ou plusieurs fichiers. Python possède pour cela de nombreux outils 
qui vous simplifient la vie. 


7.1.1 Méthode .readlines() 


Avant de passer à un exemple concret, créez un fichier dans un éditeur de texte que vous enregistrerez dans votre répertoire 
courant avec le nom zoo.txt et le contenu suivant : 
girafe 
tigre 
singe 
souris 


Ensuite, testez le code suivant dans l’interpréteur Python : 


>>> filin = open("zoo.txt", "r") 
>>> filin 
<_io.TextIOWrapper name='zoo.txt' mode='r' encoding='UTF-8'> 
>>> filin.readlines() 
['girafe\n', 'tigre\n', 'singe\n', 'souris\n'] 
>>> filin.close() 
>>> filin.readlines() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ValueError: 1/0 operation on closed file. 


Il y a plusieurs commentaires à faire sur cet exemple : 

Ligne 1. L'instruction open() ouvre le fichier zoo. txt. Ce fichier est ouvert en lecture seule, comme l’indique le se- 
cond argument r (pour read) de la fonction open(). Remarquez que le fichier n’est pas encore lu, mais simplement ouvert 
(un peu comme lorsqu’on ouvre un livre, mais qu’on ne l’a pas encore lu). Le curseur de lecture est prêt à lire le premier 
caractère du fichier. L’instruction open("zoo.txt", "r") suppose que le fichier zoo.txt est dans le répertoire depuis 
lequel l’interpréteur Python a été lancé. Si ce n’est pas le cas, il faut préciser le chemin d’accès au fichier. Par exemple, 
/home/pierre/zoo.txt pour Linux ou Mac OS X ou C: \Users\pierre\zoo.txt pour Windows. 

Ligne 2. Lorsqu’on affiche le contenu de la variable filin, on se rend compte que Python la considére comme un objet 
de type fichier ouvert (ligne 3). 

Ligne 4. Nous utilisons à nouveau la syntaxe objet .méthode() (présentée dans le chapitre 3 Affichage). Ici la méthode 
.readlines() agit sur l’objet filin en déplaçant le curseur de lecture du début à la fin du fichier, puis elle renvoie une liste 
contenant toutes les lignes du fichier (dans notre analogie avec un livre, ceci correspondrait à lire toutes les lignes du livre). 

Ligne 6. Enfin, on applique la méthode .close() sur l’objet filin, ce qui, vous vous en doutez, ferme le fichier (ceci 
correspondrait à fermer le livre). Vous remarquerez que la méthode .close() ne renvoie rien mais modifie l’état de l’objet 
filin en fichier fermé. Ainsi, si on essaie de lire à nouveau les lignes du fichier, Python renvoie une erreur car il ne peut pas 
lire un fichier fermé (lignes 7 à 10). 

Voici maintenant un exemple complet de lecture d’un fichier avec Python. 
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>>> filin = open("zoo.txt", "r") 

>>> lignes = filin.readlines() 

>>> lignes 

['girafe\n', 'tigre\n', 'singe\n', 'souris\n'] 


>>> for ligne in lignes: 
print (ligne) 

girafe 

tigre 

singe 

souris 


>>> filin.close() 


Vous voyez qu’en cinq lignes de code, vous avez lu, parcouru le fichier et affiché son contenu. 


Remarque 

— Chaque élément de la liste Lignes est une chaîne de caractères. C’est en effet sous forme de chaînes de caractères que 
Python lit le contenu d’un fichier. 

— Chaque élément de la liste Lignes se termine par le caractère \n. Ce caractère un peu particulier correspond au « saut 
de ligne ! » qui permet de passer d’une ligne à la suivante. Ceci est codé par un caractère spécial que l’on représente par 
\n. Vous pourrez parfois rencontrer également la notation octale \012. Dans la suite de cet ouvrage, nous emploierons 
aussi l’expression « retour à la ligne » que nous trouvons plus intuitive. 

— Par défaut, l'instruction print (O affiche quelque chose puis revient à la ligne. Ce retour à la ligne dû à print () se 
cumule alors avec celui de la fin de ligne (\n) de chaque ligne du fichier et donne l’impression qu’une ligne est sautée 
à chaque fois. 


Il existe en Python le mot-clé with qui permet d’ouvrir et de fermer un fichier de manière efficace. Si pour une raison ou 
une autre l’ouverture ou la lecture du fichier conduit à une erreur, l’utilisation de with garantit la bonne fermeture du fichier, 
ce qui n’est pas le cas dans le code précédent. Voici donc le même exemple avec with : 

>>> with open("zoo.txt", 'r') as filin: 
lignes = filin.readlines() 
for ligne in lignes: 
print (ligne) 
girafe 
tigre 
singe 
souris 


>>> 


Remarque 
— P'instruction with introduit un bloc d’indentation. C’est à l’intérieur de ce bloc que nous effectuons toutes les opéra- 
tions sur le fichier. 
— Une fois sorti du bloc d’indentation, Python fermera automatiquement le fichier. Vous n’avez donc plus besoin 
d’utiliser la méthode .close(). 


7.1.2 Méthode .read() 


Il existe d’autres méthodes que .readlines() pour lire (et manipuler) un fichier. Par exemple, la méthode .read() lit 
tout le contenu d’un fichier et renvoie une chaîne de caractères unique. 


>>> with open("zoo.txt", "r") as filin: 
filin.read() 


1. https://fr.wikipedia.org/wiki/Saut_de_ ligne 
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'girafe\ntigre\nsinge\nsouris\n' 
>>> 


7.13 Méthode .readline() 


La méthode .readline() (sans s à la fin) lit une ligne d’un fichier et la renvoie sous forme de chaîne de caractères. A 
chaque nouvel appel de .readline(), la ligne suivante est renvoyée. Associée à la boucle while, cette méthode permet de 
lire un fichier ligne par ligne. 


>>> with open("zoo.txt", "r") as filin: 
ligne = filin.readline() 
while ligne != "": 
print (ligne) 
ligne = filin.readline() 


girafe 
tigre 
singe 
souris 


>>> 


7.1.4 Itérations directe sur le fichier 


Python essaie de vous faciliter la vie au maximum. Voici un moyen à la fois simple et élégant de parcourir un fichier. 
>>> with open("zoo.txt", "r") as filin: 
for ligne in filin: 
print (ligne) 

girafe 

tigre 

singe 

souris 


>>> 


L'objet filin est « itérable », ainsi la boucle for va demander à Python d’aller lire le fichier ligne par ligne. 


Conseil 
Privilégiez cette méthode par la suite. 


Remarque 
Les méthodes abordées précédemment permettent d’accéder au contenu d’un fichier, soit ligne par ligne (méthode . readline ()), 

soit globalement en une seule chaîne de caractères (méthode .read()), soit globalement avec les lignes différenciées sous 

forme d’une liste de chaînes de caractères (méthode .readlines()). Il est également possible en Python de se rendre à un 

endroit particulier d’un fichier avec la méthode .seek() mais qui sort du cadre de cet ouvrage. 


7.2 Écriture dans un fichier 


Écrire dans un fichier est aussi simple que de le lire. Voyez l’exemple suivant : 


>>> animaux2 = ["poisson", "abeille", "chat"] 
>>> with open("zoo2.txt", "w") as filout: 
for animal in animaux2: 

filout.write (animal) 


BIZ. > 
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Quelques commentaires sur cet exemple : 

Ligne 1. Création d’une liste de chaînes de caractères animaux2. 

Ligne 2. Ouverture du fichier zoo2.txt en mode écriture, avec le caractère w pour write. L'instruction with crée un bloc 
d'instructions qui doit être indenté. 

Ligne 3. Parcours de la liste animaux2 avec une boucle for. 

Ligne 4. À chaque itération de la boucle, nous avons écrit chaque élément de la liste dans le fichier. La méthode . write () 
s’applique sur l’objet filout. Notez qu’à chaque utilisation de la méthode . write (), celle-ci nous affiche le nombre d’octets 
(équivalent au nombre de caractères) écrits dans le fichier (lignes 6 à 8). Ceci est valable uniquement dans l’interpréteur, si 
vous créez un programme avec les mêmes lignes de code, ces valeurs ne s’afficheront pas à l’écran. 

Si nous ouvrons le fichier zoo2.txt avec un éditeur de texte, voici ce que nous obtenons : 

poissonabeillechat 

Ce n’est pas exactement le résultat attendu car implicitement nous voulions le nom de chaque animal sur une ligne. Nous 
avons oublié d’ajouter le caractère fin de ligne après chaque nom d’animal. 

Pour ce faire, nous pouvons utiliser l’écriture formatée : 


>>> animaux2 = ["poisson", "abeille", "chat "] 
>>> with open("zoo2.txt", "w") as filout: 
for animal in animaux2: 
filout.write(f"{animal}\n") 


8 
8 
5 


Ligne 4. L’écriture formatée vue au chapitre 3 Affichage permet d’ajouter un retour à la ligne (\n) après le nom de chaque 
animal. 

Lignes 6 à 8. Le nombre d’octets écrits dans le fichier est augmenté de 1 par rapport à l’exemple précédent car le caractère 
retour à la ligne compte pour un seul octet. 

Le contenu du fichier zoo2.txt est alors : 


poisson 
abeille 
chat 


Vous voyez qu'il est extrêmement simple en Python de lire ou d’écrire dans un fichier. 


7.3 Ouvrir deux fichiers avec l’instruction with 


On peut avec l'instruction with ouvrir deux fichiers (ou plus) en même temps. Voyez l’exemple suivant : 


with open("zoo.txt", "r") as fichieri, open("zoo2.txt", "w") as fichier2: 
for ligne in fichieri: 
fichier2.write("* " + ligne) 


Si le fichier zoo. txt contient le texte suivant : 


souris 
girafe 
lion 
singe 


alors le contenu de zoo2.txt sera: 


souris 
girafe 
lion 
singe 


AX + 


Dans cet exemple, with permet une notation très compacte en s’affranchissant de deux méthodes .close(). 
Si vous souhaitez aller plus loin, sachez que l'instruction with est plus générale et est utilisable dans d’autres contextes ?. 


7.4 Note sur les retours à la ligne sous Unix et sous Windows 


Conseil : si vous étes débutant, vous pouvez sauter cette rubrique. 
On a vu plus haut que le caractère spécial \n correspondait à un retour à la ligne. C’est le standard sous Unix (Mac OS X 
et Linux). 


2. https://docs.python.org/fr/3/reference/compound_stmts.html#the-with-statement 
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Toutefois, Windows utilise deux caractères spéciaux pour le retour à la ligne : \r correspondant à un retour chariot (hérité 
des machines à écrire) et \n comme sous Unix. 

Si vous avez commencé à programmer en Python 2, vous aurez peut-être remarqué que selon les versions, la lecture de 
fichier supprimait parfois les \r et d’autres fois les laissait. Heureusement, la fonction open() dans Python 3° gère tout 
ça automatiquement et renvoie uniquement des sauts de ligne sous forme d’un seul \n (même si le fichier a été conçu sous 
Windows et qu’il contient initialement des \r). 


7.5 Importance des conversions de types avec les fichiers 


Vous avez sans doute remarqué que les méthodes qui lisent un fichier (par exemple .readlines()) vous renvoient sys- 
tématiquement des chaînes de caractères. De même, pour écrire dans un fichier il faut fournir une chaîne de caractères à la 
méthode .write(). 

Pour tenir compte de ces contraintes, il faudra utiliser les fonctions de conversions de types vues au chapitre 2 Variables : 
int (), float O et str(). Ces fonctions de conversion sont essentielles lorsqu’on lit ou écrit des nombres dans un fichier. 

En effet, les nombres dans un fichier sont considérés comme du texte, donc comme des chaînes de caractères, par la 
méthode .readlines(). Par conséquent, il faut les convertir (en entier ou en floaf) si on veut effectuer des opérations 
numériques avec. 


7.6 Du respect des formats de données et de fichiers 


Maintenant que vous savez lire et écrire des fichiers en Python, vous êtes capables de manipuler beaucoup d’information 
en biologie. Prenez garde cependant aux formats de fichiers, c’est-à-dire à la manière dont est stockée l’information biologique 
dans des fichiers. Nous vous renvoyons pour cela à l’annexe À Quelques formats de données rencontrés en biologie. 


7.7 Exercices 


Conseil : pour ces exercices, créez des scripts puis exécutez-les dans un shell. 


7.7.1 Moyenne des notes 


Le fichier notes . txt * contient les notes obtenues par des étudiants pour le cours de Python. Chaque ligne du fichier ne 
contient qu’une note. 

Téléchargez le fichier notes . txt et enregistrez-le dans votre répertoire de travail. N'hésitez pas à l’ouvrir avec un éditeur 
de texte pour voir à quoi il ressemble. 

Créez un script Python qui lit chaque ligne de ce fichier, extrait les notes sous forme de float et les stocke dans une liste. 

Terminez le script en calculant et affichant la moyenne des notes avec deux décimales. 


7.7.2 Admis ou recalé 


Le fichier notes . txt ° contient les notes obtenues par des étudiants pour le cours de Python. Chaque ligne du fichier ne 
contient qu’une note. 

Téléchargez le fichier notes.txt et enregistrez-le dans votre répertoire de travail. N’hésitez pas l’ouvrir avec un éditeur 
de texte pour voir à quoi il ressemble. 

Créez un script Python qui lit chaque ligne de ce fichier, extrait les notes sous forme de float et les stocke dans une liste. 

Le script réécrira ensuite les notes dans le fichier notes2.txt avec une note par ligne suivie de « recalé » si la note est 
inférieure à 10 et « admis » si la note est supérieure ou égale à 10. Toutes les notes seront écrites avec une décimale. À titre 
d'exemple, voici les 3 premières lignes attendues pour le fichier notes2.txt : 


13.5 admis 
17.0 admis 
9.5 recalé 


3. https://docs.python.org/fr/3/library/functions.html#open 
4. https://python.sdv.univ-paris-diderot.fr/data-files/notes.txt 
5. https://python.sdv.univ-paris-diderot.fr/data-files/notes.txt 
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FIGURE 7.1 — Point A sur le cercle de rayon r. 


7.7.3 Spirale (exercice +++) 


Créez un script spirale.py qui calcule les coordonnées cartésiennes d’une spirale à deux dimensions. 
Les coordonnées cartésiennes x, et ya d’un point A sur un cercle de rayon r s'expriment en fonction de l’angle O représenté 
sur la figure 7.1 comme : 


xa =cos(0) xr 


ya =sin(0) xr 


Pour calculer les coordonnées cartésiennes qui décrivent la spirale, vous allez faire varier deux variables en même temps : 

— langle 0, qui va prendre des valeurs de 0 à 4x radians par pas de 0.1, ce qui correspond à deux tours complets; 

— le rayon du cercle r, qui va prendre comme valeur initiale 0.5 puis que vous allez incrémenter (c’est-à-dire augmenter) 

par pas de 0.1. 

Les fonctions trigonométriques sinus et cosinus sont disponibles dans le module math que vous découvrirez plus en détails 
dans le chapitre 8 Modules. Pour les utiliser, vous ajouterez au début de votre script l'instruction : 

import math 

La fonction sinus sera math.sin() et la fonction cosinus math.cos(). Ces deux fonctions prennent comme argument 
une valeur d'angle en radian. La constante mathématique 7 sera également accessible grâce à ce module via math.pi. Par 


exemple : 
>>> math.sin(0) 
0.0 
>>> math.sin(math. pi/2) 
1.0 


>>> math.cos(math.pi) 
-1.0 


Sauvegardez ensuite les coordonnées cartésiennes dans le fichier spirale.dat en respectant le format suivant : 
— un couple de coordonnées (xa et ya) par ligne; 

— au moins un espace entre les deux coordonnées xa et ya ; 

— les coordonnées affichées sur 10 caractères avec 5 chiffres après la virgule. 

Les premières lignes de spirale.dat devrait ressembler à : 


0.50000 0.00000 
0.59700 0.05990 
0.68605 0.13907 
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0.76427 0.23642 
0.82895 0.35048 
0.87758 0.47943 
Lai Ees] 


Une fois que vous avez généré le fichier spirale .dat, visualisez votre spirale avec le code suivant (que vous pouvez 
recopier dans un autre script ou à la suite de votre script spirale . py) : 


import matplotlib.pyplot as plt 


x = [] 
y = [] 
with open("spirale.dat", 
for line in f_in: 
coords = line.split() 
x.append(float (coords [0])) 
y.append(float (coords [1])) 


plt.figure(figsize=(8,8)) 
mini = min(x+y) * 1.2 

maxi = max(x+y) * 1.2 
plt.xlim(mini, maxi) 
plt.ylim(mini, maxi) 
plt.plot(x, y) 
plt.savefig("spirale. png") 


Visualisez l’image spirale.png ainsi créée. 


Remarque 


"r") as f_in: 


Le module matplotlib est utilisé ici pour la visualisation de la spirale. Son utilisation est détaillée dans le chapitre 17 


Quelques modules d'intérét en bioinformatique. 


Essayez de jouer sur les paramètres 0 et r, et leur pas d'incrémentation, pour construire de nouvelles spirales. 
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Chapitre 8 


Modules 


8.1 Définition 


Les modules sont des programmes Python qui contiennent des fonctions que l’on est amené à réutiliser souvent (on les 
appelle aussi bibliothèques ou libraries). Ce sont des « boîtes à outils » qui vont vous être très utiles. 

Les développeurs de Python ont mis au point de nombreux modules qui effectuent une quantité phénoménale de tâches. 
Pour cette raison, prenez toujours le réflexe de vérifier si une partie du code que vous souhaitez écrire n’existe pas déjà sous 
forme de module. 

La plupart de ces modules sont déjà installés dans les versions standards de Python. Vous pouvez accéder à une docu- 
mentation exhaustive ! sur le site de Python. N'hésitez pas à explorer un peu ce site, la quantité de modules disponibles est 
impressionnante (plus de 300). 


8.2 Importation de modules 


Dans les chapitres précédents, nous avons rencontré la notion de module plusieurs fois. Notamment lorsque nous avons 
voulu tirer un nombre aléatoire : 


>>> import random 
>>> random.randint (O0, 10) 
4 


Regardons de plus prés cet exemple : 
— Ligne 1, l'instruction import donne accès à toutes les fonctions du module random”. 
— Ensuite, ligne 2, nous utilisons la fonction randint(0, 10) du module random. Cette fonction renvoie un nombre 
entier tiré aléatoirement entre O inclus et 10 inclus. 
Nous avons également croisé le module math lors de l’exercice sur la spirale (voir chapitre 7 Fichiers). Ce module nous a 
donné accès aux fonctions trigonométriques sinus et cosinus, et à la constante 7 : 


>>> import math 

>>> math.cos(math.pi / 2) 
6.123233995736766e-17 

>>> math.sin(math.pi / 2) 
1.0 


En résumé, l’utilisation de la syntaxe import module permet d’importer tout une série de fonctions organisées par « 
thèmes ». Par exemple, les fonctions gérant les nombres aléatoires avec random et les fonctions mathématiques avec math. 
Python possède de nombreux autres modules internes (c’est-à-dire présent de base lorsqu'on installe Python). 


Remarque 
Dans le chapitre 3 Affichage, nous avons introduit la syntaxe truc.bidule() avec truc étant un objet et .bidule() une 
méthode. Nous vous avions expliqué qu’une méthode était une fonction un peu particulière : 
— elle était liée à un objet par un point; 
— en général, elle agissait sur ou utilisait l’objet auquel elle était liée. 


1. https://docs.python.org/fr/3/py-modindex.html 
2. https://docs.python.org/fr/3/1ibrary/random.html#module-random 
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Par exemple, la méthode . format () (vue au chapitre 3) dans l’instruction "{}" . format (3.14) utilise l’objet chaîne de 
caractères "{}" (auquel elle est liée) pour finalement renvoyer une autre chaîne de caractères "3.14". 

Avec les modules, nous rencontrons une syntaxe similaire. Par exemple, dans l’instruction math. cos (), on pourrait penser 
que .cos() est aussi une méthode. En fait la documentation officielle de Python ° précise bien que dans ce cas .cos() est 
une fonction. Dans cet ouvrage, nous utiliserons ainsi le mot fonction lorsqu’on évoquera des fonctions issues de modules. 

Si cela vous parait encore ardu, ne vous inquiétez pas, c’est a force de pratiquer et de lire que vous vous approprierez le 
vocabulaire. Ici, la syntaxe module .fonction() est lá pour rappeler de quel module provient la fonction en un coup d’ ceil! 


Il existe un autre moyen d’importer une ou plusieurs fonctions d’un module : 


>>> from random import randint 
>>> randint (0,10) 


7 
À Paide du mot-clé from, on peut importer une fonction spécifique d’un module donné. Remarquez bien qu’il est inutile 
de répéter le nom du module dans ce cas, seul le nom de la fonction en question est requis. 
On peut également importer toutes les fonctions d’un module : 


>>> from random import * 


>>> randint (0,50) 
46 


>>> uniform(0,2.5) 
0.64943174760727951 
L’instruction from random import * importe toutes les fonctions du module random. On peut ainsi utiliser toutes ses 
fonctions directement, comme par exemple randint () et uniform() qui renvoie des nombres aléatoires entiers et floats. 
Dans la pratique, plutôt que de charger toutes les fonctions d’un module en une seule fois : 


from random import * 


nous vous conseillons de charger le module seul de la manière suivante : 


import random 


puis d’appeler explicitement les fonctions voulues, par exemple : 


random.randint (0,2) 


Il est également possible de définir un alias (un nom plus court) pour un module : 


>>> import random as rand 


>>> rand.randint (1, 10) 
6 


>>> rand.uniform(1, 3) 
2.643472616544236 


Dans cet exemple, les fonctions du module random sont accessibles via l’alias rand. 
Enfin, pour vider de la mémoire un module déjà chargé, on peut utiliser l'instruction del : 
>>> import random 

>>> random.randint (0,10) 

2 

>>> del random 

>>> random.randint (0,10) 


Traceback (most recent call last): 
File "<stdin>", line 1, in ? 
NameError: name 'random' is not defined 


On constate alors qu’un rappel (ligne 5) d’une fonction du module random après l’avoir vidé de la mémoire (ligne 4) 
retourne un message d’erreur (lignes 6-8). 


8.3 Obtenir de l’aide sur les modules importés 


Pour obtenir de l’aide sur un module rien de plus simple, il suffit d’utiliser la commande he1p() : 


>>> import random 
>>> help(random) 


Loi] 


Ce qui renvoie quelque chose du type : 


3. https: //docs.python.org/fr/3/tutorial/modules.html 
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Help on module random: 


NAME 
random - Random variable generators. 


MODULE REFERENCE 
https://docs.python.org/3.7/library/random 


The following documentation is automatically generated from the Python 
source files. It may be incomplete, incorrect or include features that 
are considered implementation detail and may vary between Python 
implementations. When in doubt, consult the module reference at the 
location listed above. 


DESCRIPTION 
integers 


uniform within range 


sequences 


pick random element 
pick random sample 


Remarque 


— Pour vous déplacer dans l’aide, utilisez les flèches du haut et du bas pour parcourir les lignes les unes après les autres, 
ou les touches page-up et page-down pour faire défiler l’aide page par page. 

— Pour quitter l’aide, appuyez sur la touche Q. 

— Pour chercher du texte, tapez le caractére / puis le texte que vous cherchez puis la touche Entrée. Par exemple, pour 
chercher l’aide sur la fonction randint (), tapez /randint puis Entrée. 

— Vous pouvez également obtenir de l’aide sur une fonction particulière d’un module de la manière suivante : 
help(random.randint) 


La commande help () est en fait une commande plus générale permettant d’avoir de l’aide sur n'importe quel objet chargé 
en mémoire. 


>>> t = [1, 2, 3] 
>>> help(t) 
Help on list object: 


class list(object) 
| list() -> new list 
list(sequence) -> new list initialized from sequence's items 


Methods defined here: 


_add__(...) 
x.__add__ (y) <==> x+y 


` 


Enfin, pour connaître d’un seul coup d’ceil toutes les méthodes ou variables associées à un objet, utilisez la fonction 
dir(): 


>>> import random 
>>> dir (random) 
['BPF', 'LOG4', 'NV_MAGICCONST', 'RECIP_BPF', 'Random', 'SG_MAGICCONST', 
'SystemRandom', 'TWOPI', 'WichmannHill', '_BuiltinMethodType', '_MethodT 
pets salt..." eo burt ins 4, «does. 2 file__', '__name__', '_ac 
os, -!_ceil!, * O'S _exp', '_hexlify', _inst', '_log', '_pi', 
'_random', '_sin', _sqrt', '_test', '_test_generator', '_urandom', '_w 
rn', 'betavariate', 'choice', 'expovariate', 'gammavariate', 'gauss', ' 
etrandbits', 'getstate', 'jumpahead', 'lognormvariate', 'normalvariate' 
'paretovariate', 'randint', 'random', 'randrange', 'sample', 'seed', ' 


etstate', 'shuffle', 'uniform', 'vonmisesvariate', 'weibullvariate'] 
>>> 


' $ 1 


_cos', 
1 


a 
8 


, 
s 
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8.4 Quelques modules courants 


Il existe une série de modules que vous serez probablement amenés à utiliser si vous programmez en Python. En voici une 
liste non exhaustive. Pour la liste complète, reportez-vous à la page des modules * sur le site de Python : 

— math? : fonctions et constantes mathématiques de base (sin, cos, exp, pi...). 

— sys ° : interaction avec l’interpréteur Python, passage d’arguments (cf. plus bas). 

— os” : dialogue avec le système d’ exploitation (cf. plus bas). 

— random? : génération de nombres aléatoires. 

— time? : accès à l’heure de I’ ordinateur et aux fonctions gérant le temps. 

— urllib  : récupération de données sur internet depuis Python. 

— Tkinter !! : interface python avec Tk. Création d’ objets graphiques (cf. chapitre 20 Fenêtres graphiques et Tkinter). 

— re !? : gestion des expressions régulières (cf. chapitre 16 Expressions régulières et parsing*). 

Nous vous conseillons d’aller explorer les pages de ces modules pour découvrir toutes leurs potentialités. 

Vous verrez dans le chapitre 14 Création de module comment créer votre propre module lorsque vous souhaitez réutiliser 
souvent vos propres fonctions. 

Enfin, notez qu'il existe de nombreux autres modules externes qui ne sont pas installés de base dans Python mais qui 
sont très utilisés en bioinformatique et en analyse de données. Citons-en quelques-uns : NumPy (manipulations de vecteurs 
et de matrices, algèbre linéaire), Biopython (recherche dans les banques de données biologiques, manipulation de séquences 
ou de structures de biomolécules), matplotlib (représentations graphiques : courbes, nuages de points, diagrammes en bâ- 
tons... ), pandas (analyse de données)... Ces modules vous serons présentés dans le chapitre 17 Quelques modules d'intérêt 
en bioinformatique. 


8.5 Module random : génération de nombres aléatoires 


Comme indiqué précédemment le module random !? contient des fonctions pour la génération de nombres aléatoires : 


>>> import random 


>>> random.randint (O0, 10) 
4 


>>> random.randint(0, 10) 
10 


>>> random.uniform(O, 10) 
6.574743184892878 

>>> random.uniform(O, 10) 
1.1655547702189106 


Le module random permet aussi de permuter aléatoirement des listes : 


>>> x = [1, 2, 3, 4] 
>>> random.shuffle(x) 
>>> x 

[2, 3, 1, 4] 

>>> random. shuffle (x) 
>>> x 


[4, 2, 1, 3] 


Mais aussi de tirer alétoirement un ou plusieurs éléments dans une liste donnée : 


>>> bases = cva" wep rom 40] 
>>> random.choice(bases) 

EAU 

>>> random.choice(bases) 

tg 

>>> random.choices(bases, k=5) 
['G'! "A! LA! ET! 1G'] 

>>> random.choices(bases, k=5) 


4. https: //docs.python. org/fr/3/py-modindex. html 

5. https://docs.python.org/fr/3/library/math.html#module-math 

6. https://docs.python.org/fr/3/library/sys.html#module-sys 

7. https://docs.python.org/fr/3/library/os.html#module-os 

8. https: //docs.python. org/fr/3/library/random.html#module-random 
9. https://docs.python.org/fr/3/library/time.html#module-time 

10. https: //docs.python. org/fr/3/library/urllib.html#module-urllib 
11. https://docs.python.org/fr/3/library/tkinter.html#module-tkinter 
12. https://docs.python.org/fr/3/library/re.html#module-re 

13. https://docs.python.org/fr/3/1ibrary/random.html#module-random 
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C'A' ep LA! "A gaj 
>>> random.choices (bases, k=10) 
Let T y T g 'T!, 'G', 'A', "Cr; NAO Ges 1G'] 


La fonction choice () tire aléatoirement un élément d’une liste alors que choices () (avec un s à la fin) réalise plusieurs 
tirages aléatoires, dont le nombre est précisé par le paramètre k. 

Si vous exécutez vous-même les exemples précédents, vous devriez obtenir des résultats légèrement différents de ceux 
indiqués. C’est l’intérêt de l’aléatoire ! 

Pour des besoins de reproductibilité des analyses en science, on a souvent besoin de retrouver les mêmes résultats même 
si on utilise des nombres aléatoires. Pour cela, on peut définir ce qu’on appelle la « graine aléatoire ». 


Définition 

En informatique, la généreration de nombres aléatoires est un problème complexe. On utilise plutôt des « générateurs 
de nombres pseudo-aléatoires '* ». Pour cela, une graine aléatoire '? doit être définie. Cette graine est la plupart du temps 
un nombre entier qu’on passe au générateur, celui-ci va alors produire une série donnée de nombres pseudo-aléatoires qui 
dépendent de cette graine. Si on change la graine, la série de nombres change. 


En Python, la graine aléatoire se définit avec la fonction seed() : 


>>> random.seed(42) 


>>> random.randint (O0, 10) 
1 


>>> random.randint(0, 10) 
0 


>>> random.randint(0, 10) 
4 


Ici la graine aléatoire est fixée à 42. Si on ne précise pas la graine, par défaut Python utilise la date. Plus précisément, il 
s’agit du nombre de secondes écoulées depuis une date donnée du passé. Ainsi, à chaque fois qu’on relance Python, la graine 
sera différente car ce nombre de secondes sera différent. 

Si vous exécutez ces mêmes lignes de code (depuis l’instruction random. seed (42) ), il se peut que vous ayez des résultats 
différents selon la version de Python. Néanmoins, vous devriez systématiquement obtenir les mêmes résultats si vous relancez 
plusieurs fois de suite ces instructions sur une même machine. 


Remarque 

Quand on utlise des nombres aléatoires, il est fondamental de connaitre la distribution de probablités utilisée par la fonc- 
tion. Par exemple, La fonction de base du module random est random.random(), elle renvoie un float aléatoire entre 0 
et 1 tiré dans une distribution uniforme. Si on tire beaucoup de nombres, on aura la même probabilité d’obtenir tous les 
nombres possibles entre O et 1. La fonction random. randint () tire aussi un entier dans une distribution uniforme. La fonc- 
tion random. gauss () tire quant à elle un float aléatoire dans une distribution Gaussienne. 


8.6 Module sys : passage d’arguments 


Le module sys! contient des fonctions et des variables spécifiques à l’interpréteur Python lui-même. Ce module est 
particulièrement intéressant pour récupérer les arguments passés à un script Python lorsque celui-ci est appelé en ligne de 
commande. 

Dans cet exemple, créons le court script suivant que l’on enregistrera sous le nom test.py : 


import sys 
print(sys.argv) 


Ensuite, dans un shell, exécutons le script test .py suivi de plusieurs arguments. Par exemple : 


$ python test.py salut girafe 42 
['test.py', 'salut', 'girafe', '42'] 


14. https: //fr.wikipedia.org/wiki/G/C3/A9n/C3/A9rateur_de_nombres_pseudo-al/C3/A9atoires 
15. https: //fr.wikipedia.org/wiki/Graine_a1/C3/A9atoire 
16. https://docs.python.org/fr/3/1ibrary/sys.html#module-sys 
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Ligne 1. Le caractère $ représente l’invite du shell, test .py est le nom du script Python, salut, girafe et 42 sont les 
arguments passés au script (tous séparés par un espace). 

Ligne 2. Le script affiche le contenu de la variable sys. argv. Cette variable est une liste qui contient tous les arguments 
de la ligne de commande, y compris le nom du script lui-même qu’on retrouve comme premier élément de cette liste dans 
sys.argv[0]. On peut donc accéder à chacun des arguments du script avec sys.argv[1], sys.argv([2]... 

Toujours dans le module sys, la fonction sys .exit () est utile pour quitter un script Python. On peut donner un argument 
à cette fonction (en général une chaîne de caractères) qui sera renvoyé au moment où Python quittera le script. Par exemple, 
si vous attendez au moins un argument en ligne de commande, vous pouvez renvoyer un message pour indiquer à l’utilisateur 
ce que le script attend comme argument : 


import sys 


if len(sys.argv) != 2: 
sys.exit ("ERREUR : il faut exactement un argument .") 


print (f"Argument vaut : {sys.argv[1]}") 


Puis on l’exécute sans argument : 


$ python test.py 
ERREUR : il faut exactement un argument. 


et avec un argument : 


$ python test.py 42 
Argument vaut : 42 


Notez qu’ici on vérifie que le script possède deux arguments car le nom du script lui-même compte pour un argument (le 
tout premier). 

L'intérêt de récupérer des arguments passés dans la ligne de commande à l’appel du script est de pouvoir ensuite les utiliser 
dans le script. 

Voici à titre d’exemple le script compte_lignes.py qui va prendre comme argument le nom d’un fichier puis afficher le 
nombre de lignes qu’il contient. 


import sys 


if len(sys.argv) != 2: 
sys.exit ("ERREUR : il faut exactement un argument .") 
nom_fichier = sys.argv[1] 
taille = 0 
with open(nom_fichier, "r") as f_in: 
taille = len(f_in.readlines()) 


print (f"{nom_fichier} contient {taille} lignes.") 


Supposons que dans le méme répertoire, nous ayons le fichier zoo1.txt dont voici le contenu : 


girafe 
tigre 
singe 
souris 


et le fichier zoo2.txt qui contient : 


poisson 
abeille 
chat 


Utilisons maintenant notre script compte_lignes.py : 


$ python compte_lignes.py 
ERREUR : il faut exactement un argument. 


$ python compte_lignes.py zooi.txt 
zooil.txt contient 4 lignes. 


$ python compte_lignes.py zoo2.txt 
zoo2.txt contient 3 lignes. 
Notre script est donc capable de : 
— Vérifier si un argument lui est donné et si ce n’est pas le cas d’afficher un message d’ erreur. 
— D'ouvrir le fichier dont le nom est fourni en argument, de compter puis d’afficher le nombre de lignes. 
Par contre, le script ne vérifie pas si le fichier existe bien : 
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$ python compte _lignes.py zoo3.txt 
Traceback (most recent call last): 


File "compte_lignes.py", line 8, in <module> 
with open(nom_fichier, "r") as f_in: 
FileNotFoundError: [Errno 2] No such file or directory: 'zoo3.txt' 


La lecture de la partie suivante va nous permettre d’améliorer notre script compte_lignes. py. 


8.7 Module os : interaction avec le système d’exploitation 


Le module os |” gère l'interface avec le système d’exploitation. 
La fonction os.path.exists() est une fonction pratique de ce module qui vérifie la présence d’un fichier sur le disque 
dur. 


>>> import sys 
>>> import os 
>>> if os.path.exists("toto.pdb"): 


print("le fichier est présent") 
else: 


sys.exit("le fichier est absent") 


le fichier est absent 


Dans cet exemple, si le fichier n’existe pas sur le disque, on quitte le programme avec la fonction exit () du module sys 
que nous venons de voir. 
La fonction os. getcwd() renvoie le répertoire (sous forme de chemin complet) depuis lequel est lancé Python : 
>>> import os 
>>> os. getcwd() 
'/home/pierre' 
Enfin, la fonction os.listdir() renvoie le contenu du répertoire depuis lequel est lancé Python : 
>>> import os 
>>> os.listdir() 
['1BTA.pdb', 'demo.py', 'tests'] 
Le résultat est renvoyé sous forme d’une liste contenant à la fois le nom des fichiers et des répertoires. 
Il existe de nombreuse autres fonctions dans le module os, n'hésitez pas á consulter la documentation. 


8.8 Exercices 


Conseils : pour les trois premiers exercices, utilisez l’interpréteur Python. Pour les exercices suivants, créez des scripts 
puis exécutez-les dans un shell. 


8.8.1 Racine carrée 


Affichez sur la même ligne les nombres de 10 à 20 (inclus) ainsi que leur racine carrée avec 3 décimales. Utilisez pour 
cela le module math avec la fonction sqrt (). Exemple : 


10 3.162 
11 3.317 
12 3.464 
13 3.606 


Luto.) 
Documentation de la fonction math. sqrt () : 
https://docs.python.org/fr/3/library/math.htmlitmath.sqrt 


8.8.2 Cosinus 


Calculez le cosinus de 2/2 en utilisant le module math avec la fonction cos () et la constante pi. 
Documentation de la fonction math.cos() : 

https://docs.python. org/fr/3/library/math.html#math.cos 

Documentation de la constante math. pi : 
https://docs.python.org/fr/3/library/math.htmlitmath. pi 


17. https://docs.python.org/fr/3/library/os.html#module-os 


Cours de Python / Université de Paris / UFR Sciences du Vivant 63 


Chapitre 8. Modules 8.8. Exercices 


64 


8.8.3 Nom et contenu du répertoire courant 


Affichez le nom et le contenu du répertoire courant (celui depuis lequel vous avez lancé l’interpréteur Python). 
Déterminez également le nombre total de fichiers et de répertoires présents dans le répertoire courant. 
Documentation de la fonction os .getcwd() : 
https://docs.python.org/fr/3/library/os.html#os.getcwd 

Documentation de la fonction os.listdir () : 
https://docs.python.org/fr/3/library/os.htmltos.listdir 


8.8.4 Affichage temporisé 


Affichez les nombres de 1 à 10 avec 1 seconde d'intervalle. Utilisez pour cela le module time et sa fonction sleep().. 
Documentation de la fonction time .sleep() : 
https://docs.python.org/fr/3/library/time.html#time.sleep 


8.8.5 Séquences aléatoires de chiffres 


Générez une séquence aléatoire de 6 chiffres, ceux-ci étant des entiers tirés entre 1 et 4. Utilisez le module random avec 
la fonction randint(). 

Documentation de la fonction random.randint () : 

https://docs.python. org/fr/3/library/random.html#random.randint 


8.8.6 Séquences aléatoires d’ADN 


Générez une séquence aléatoire d’ADN de 20 bases de deux manières différentes. Utilisez le module random avec la 
fonction randint () ou choice(). 

Documentation de la fonction random.randint () : 

https://docs.python.org/fr/3/library/random.html#random.randint 

Documentation de la fonction random. choice() : 

https: //docs.python. org/fr/3/library/random.html#random. choice 


8.8.7 Séquences aléatoires d’ADN avec argument 


Créez un script dna_random.py qui prend comme argument un nombre de bases, construit une séquence aléatoire d’ ADN 
dont la longueur est le nombre de bases fourni en argument, puis affiche cette séquence. 

Le script devra vérifier qu’un argument est bien fourni et renvoyer un message d’erreur si ce n’est pas le cas. 

Conseil : pour générer la séquence d’ ADN, vous utiliserez, au choix, la fonction 
random. randint () ou random.choice() abordées dans l’exercice précédent. 


8.8.8 Compteur de lignes 


Améliorez le script compte_lignes. py dont le code a été donné précédemment de façon à ce qu’il renvoie un message 
d'erreur si le fichier n’existe pas. Par exemple, si les fichiers zoo1 . txt et zoo2.txt sont bien dans le répertoire courant, mais 
pas zoo3.txt : 


$ python compte _lignes.py zooi.txt 
zoo1l.txt contient 4 lignes. 


$ python compte _lignes.py zoo2.txt 
zoo2.txt contient 3 lignes. 


$ python compte_lignes.py zoo3.txt 
ERREUR : zoo3.txt n'existe pas. 


8.8.9 Détermination du nombre pi par la méthode Monte Carlo (exercice +++) 


Soit un cercle de rayon 1 (en trait plein sur la figure 8.1) inscrit dans un carré de côté 2 (en trait pointillé). 

Avec R = 1, l'aire du carré vaut (2R)? soit 4 et l’aire du disque délimité par le cercle vaut TR? soit 7. 

En choisissant N points aléatoires (à l’aide d’une distribution uniforme) à l’intérieur du carré, la probabilité que ces points 
se trouvent aussi dans le cercle est : 
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1 


a 
hy 


FIGURE 8.1 — Cercle de rayon 1 inscrit dans un carré de côté 2. 


aire du cercle m 


D i—i = T= 
aire du carré 4 


Soit n, le nombre de points effectivement dans le cercle, il vient alors 


_n TĦ 
PENA 
d’où 
m=4x". 
N 


Déterminez une approximation de 7 par cette méthode. Pour cela, pour N itérations : 
— Choisissez aléatoirement les coordonnées x et y d’un point entre -1 et 1. Utilisez la fonction uniform() du module 
random. 

— Calculez la distance entre le centre du cercle et ce point. 

— Déterminez si cette distance est inférieure au rayon du cercle, c’est-à-dire si le point est dans le cercle ou pas. 

— Si le point est effectivement dans le cercle, incrémentez le compteur n. 

Finalement calculez le rapport entre n et N et proposez une estimation de m. Quelle valeur de m obtenez-vous pour 100 
itérations ? 1000 itérations ? 10 000 itérations ? Comparez les valeurs obtenues à la valeur de 7 fournie par le module math. 

On rappelle que la distance d entre deux points A et B de coordonnées respectives (x4, ya) et (xg, yg) se calcule comme : 


d = y/ (xe — x4)? + (ys — Y4)? 


Documentation de la fonction random.uniform() : 
https://docs.python.org/fr/3/library/random.html#random.uniform 
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Chapitre 9 


Fonctions 


9.1 Principe et généralités 


En programmation, les fonctions sont très utiles pour réaliser plusieurs fois la même opération au sein d’un programme. 


Elles rendent également le code plus lisible et plus clair en le fractionnant en blocs logiques. 
Vous connaissez déjà certaines fonctions Python. Par exemple math.cos(angle) du module math renvoie le cosinus de 
la variable angle exprimé en radian. Vous connaissez aussi des fonctions internes à Python comme range() ou len(). Pour 


l'instant, une fonction est à vos yeux une sorte de « boîte noire » (voir figure 9.1) : 
1. À laquelle vous passez aucune, une ou plusieurs variable(s) entre parenthèses. Ces variables sont appelées arguments. 
Il peut s’agir de n’importe quel type d’objet Python. 
2. Qui effectue une action. 
3. Et qui renvoie un objet Python ou rien du tout. 
Par exemple, si vous appelez la fonction len() de la manière suivante : 


>>> len([0, 1, 2]) 
3 


voici ce qui se passe : 

1. vous appelez len () en lui passant une liste en argument (ici la liste [O, 1, 2]); 

2. la fonction calcule la longueur de cette liste; 

3. elle vous renvoie un entier égal à cette longueur. 

Autre exemple, si vous appelez la méthode ma_liste.append() (n’oubliez pas, une méthode est une fonction qui agit 


sur l’objet auquel elle est attachée par un point) : 


2) action effectuée 


fonction(..., ...) 


3) renvoi d'un objet 
Python ou de rien du tout 


1) appel de la fonction : 
passage de 0, 1, ou 
plusieurs argument(s) 


programme 
principal 


FIGURE 9.1 — Fonctionnement schématique d’une fonction. 
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>>> ma_liste.append(5) 


1. Vous passez l’entier 5 en argument; 
2. la méthode append() ajoute l’entier 5 à l’objetma_liste; 


3. et elle ne renvoie rien. 


Aux yeux du programmeur au contraire, une fonction est une portion de code effectuant une suite d’instructions bien 
particulière. Mais avant de vous présenter la syntaxe et la manière de construire une fonction, revenons une dernière fois sur 
cette notion de « boîte noire » : 

— Une fonction effectue une tâche. Pour cela, elle reçoit éventuellement des arguments et renvoie éventuellement quelque 
chose. L’algorithme utilisé au sein de la fonction n’intéresse pas directement l’utilisateur. Par exemple, il est inutile 
de savoir comment la fonction math.cos() calcule un cosinus. On a juste besoin de savoir qu’il faut lui passer en 
argument un angle en radian et qu’elle renvoie le cosinus de cet angle. Ce qui se passe à l’intérieur de la fonction ne 
regarde que le programmeur. 

— Chaque fonction effectue en général une tâche unique et précise. Si cela se complique, il est plus judicieux d’écrire 
plusieurs fonctions (qui peuvent éventuellement s’appeler les unes les autres). Cette modularité améliore la qualité 
générale et la lisibilité du code. Vous verrez qu’en Python, les fonctions présentent une grande flexibilité. 

Pour finir sur les généralités, nous avons utilisé dans la Figure 9.1 le terme programme principal (main en anglais) pour 
désigner l’endroit depuis lequel on appelle une fonction (on verra plus tard que l’on peut en fait appeler une fonction de 
n'importe où). Le programme principal désigne le code qui est exécuté lorsqu’on lance le script Python, c’est-à-dire toute 
la suite d’instructions en dehors des fonctions. En général, dans un script Python, on écrit d’abord les fonctions puis le 
programme principal. Nous aurons l’occasion de revenir sur cette notion de programme principal plus tard dans ce chapitre 
ainsi que dans le chapitre 12 Plus sur les fonctions. 


9.2 Définition 


Pour définir une fonction, Python utilise le mot-clé def. Si on souhaite que la fonction renvoie quelque chose, il faut 
utiliser le mot-clé return. Par exemple : 


>>> def carre(x): 
return x**2 


>>> print(carre(2)) 
4 


Notez que la syntaxe de def utilise les deux-points comme les boucles for et while ainsi que les tests if, un bloc 
d'instructions est donc attendu. De même que pour les boucles et les tests, l’indentation de ce bloc d’instructions (qu’on 
appelle le corps de la fonction) est obligatoire. 

Dans l’exemple précédent, nous avons passé un argument à la fonction carre() qui nous a renvoyé (ou retourné) une 
valeur que nous avons immédiatement affichée à l’écran avec l’instruction print (). Que veut dire valeur renvoyée ? Et bien 
cela signifie que cette dernière est récupérable dans une variable : 


>>> res = carre (2) 
>>> print (res) 


Ici, le résultat renvoyé par la fonction est stocké dans la variable res. Notez qu’une fonction ne prend pas forcément un 
argument et ne renvoie pas forcément une valeur, par exemple : 
>>> def hello(): 
print ("bonjour") 
>>> hello () 
bonjour 
Dans ce cas la fonction, hello () se contente d’ afficher la chaîne de caractères "bonjour" à l’écran. Elle ne prend aucun 
argument et ne renvoie rien. Par conséquent, cela n’a pas de sens de vouloir récupérer dans une variable le résultat renvoyé 
par une telle fonction. Si on essaie tout de méme, Python affecte la valeur None qui signifie rien en anglais : 


>>> var = hello() 
bonjour 

>>> print (var) 
None 


Ceci n’est pas une faute car Python n’émet pas d’ erreur, toutefois cela ne présente, la plupart du temps, guère d’intérêt. 
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9.3 Passage d’arguments 


Le nombre d’arguments que l’on peut passer à une fonction est variable. Nous avons vu ci-dessus des fonctions auxquelles 
on passait 0 ou 1 argument. Dans les chapitres précédents, vous avez rencontré des fonctions internes à Python qui prenaient 
au moins 2 arguments. Souvenez-vous par exemple de range(1, 10) ou encore range(1, 10, 2). Le nombre d’argument 
est donc laissé libre à l’initiative du programmeur qui développe une nouvelle fonction. 

Une particularité des fonctions en Python est que vous n’êtes pas obligé de préciser le type des arguments que vous lui 
passez, dès lors que les opérations que vous effectuez avec ces arguments sont valides. Python est en effet connu comme étant 
un langage au « typage dynamique », c’est-à-dire qu’il reconnaît pour vous le type des variables au moment de l’exécution. 
Par exemple : 

>>> def fois(x, y): 
... return x*y 

>>> fois(2, 3) 

6 

>>> fois(3.1415, 5.23) 
16.430045000000003 

>>> fois("to", 2) 
'toto' 


>>> fois([1,3], 2) 
[1, 3, 1, 3] 


L'opérateur * reconnaît plusieurs types (entiers, floats, chaînes de caractères, listes). Notre fonction fois() est donc 
capable d’effectuer des tâches différentes ! Même si Python autorise cela, méfiez-vous tout de même de cette grande flexibilité 
qui pourrait conduire à des surprises dans vos futurs programmes. En général, il est plus judicieux que chaque argument ait 
un type précis (entiers, floats, chaînes de caractères, etc) et pas l’un ou l’autre. 


9.4 Renvoi de résultats 


Un énorme avantage en Python est que les fonctions sont capables de renvoyer plusieurs objets à la fois, comme dans cette 
fraction de code : 


>>> def carre_cube(x): 
return x**2, x**3 


>>> carre_cube (2) 
(4, 8) 


En réalité Python ne renvoie qu’un seul objet, mais celui-ci peut être séquentiel, c’est-à-dire contenir lui même d’autres 
objets. Dans notre exemple Python renvoie un objet de type tuple, type que nous verrons dans le chapitre 13 Dictionnaires et 
tuples (grosso modo, il s’agit d’une sorte de liste avec des propriétés différentes). Notre fonction pourrait tout autant renvoyer 
une liste : 


>>> def carre _cube2(x): 
return [x**2, xxx3] 


>>> carre_cube2(3) 
[9, 27] 


Renvoyer un tuple ou une liste de deux éléments (ou plus) est très pratique en conjonction avec l’affectation multiple, par 
exemple : 


>>> z1, z2 = carre_cube2(3) 
>>> z1 

9 

>>> z2 

27 


Cela permet de récupérer plusieurs valeurs renvoyées par une fonction et de les affecter à la volée à des variables diffé- 
rentes. 


9.5 Arguments positionnels et arguments par mot-clé 


Jusqu’ à maintenant, nous avons systématiquement passé le nombre d’ arguments que la fonction attendait. Que se passe-t-il 
si une fonction attend deux arguments et que nous ne lui en passons qu’un seul ? 
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>>> def fois(x, y): 
... return x*y 
>>> fois(2, 3) 
6 
>>> fois(2) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: fois() missing 1 required positional argument: 'y' 


On constate que passer un seul argument à une fonction qui en attend deux conduit à une erreur. 


Définition 

Lorsqu'on définit une fonction def fct(x, y): les arguments x et y sont appelés arguments positionnels (en anglais 
positional arguments). Il est strictement obligatoire de les préciser lors de l’appel de la fonction. De plus, il est nécessaire de 
respecter le même ordre lors de l’appel que dans la définition de la fonction. Dans l’exemple ci-dessus, 2 correspondra à x et 
3 correspondra à y. Finalement, tout dépendra de leur position, d’où leur qualification de positionnel. 


Mais il est aussi possible de passer un ou plusieurs argument(s) de manière facultative et de leur attribuer une valeur par 
défaut : 


>>> def fct(x=1): 
pue return x 
>>> fct() 

1 

>>> fct(10) 

10 


Définition 

Un argument défini avec une syntaxe def fct(arg=val) : est appelé argument par mot-clé (en anglais keyword argu- 
ment). Le passage d’un tel argument lors de l’appel de la fonction est facultatif. Ce type d’argument ne doit pas être confondu 
avec les arguments positionnels présentés ci-dessus, dont la syntaxe est def fct(arg):. 


Il est bien sûr possible de passer plusieurs arguments par mot-clé : 


>>> def fct(x=0, y=0, z=0): 
ahs return x, y, Z 

>>> fct() 

(0, 0, 0) 

>>> fct (10) 

(10, 0, 0) 

>>> fct(10, 8) 

(10, 8, 0) 

>>> fct(10, 8, 3) 

(10, 8, 3) 


On observe que pour l’instant, les arguments par mot-clé sont pris dans l’ordre dans lesquels on les passe lors de l’ appel. 
Comment pourrions-nous faire si on souhaitait préciser l’ argument par mot-clé z et garder les valeurs de x et y par défaut ? 
Simplement en précisant le nom de l’argument lors de l’appel : 


>>> fct(z=10) 
(0, 0, 10) 


Python permet même de rentrer les arguments par mot-clé dans un ordre arbitraire : 


>>> fct(z=10, x=3, y=80) 


(3, 80, 10) 
>>> fct(z=10, y=80) 
(0, 80, 10) 


Que se passe-t-il lorsque nous avons un mélange d’ arguments positionnels et par mot-clé ? Et bien les arguments position- 
nels doivent toujours être placés avant les arguments par mot-clé : 


>>> def fct(a, b, x=0, y=0, z=0): 
on return a, b, x, y, Z 


>>> fct(1, 1) 
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(1, 1, 0, 0, 0) 

>>> fct(1, 1, z=5) 

(1, 1, 0, 0, 5) 

>>> fct(1, 1, z=5, y=32) 
(ls Ty 0, 32, 5) 


On peut toujours passer les arguments par mot-clé dans un ordre arbitraire à partir du moment où on précise leur nom. Par 
contre, si les deux arguments positionnels a et b ne sont pas passés à la fonction, Python renvoie une erreur. 


>>> fct(z=0) 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
TypeError: fct() missing 2 required positional arguments: 'a' and 'b' 
Conseil 


Préciser le nom des arguments par mot-clé lors de l’appel d’une fonction est une pratique que nous vous recommandons. 
Cela les distingue clairement des arguments positionnels. 


L'utilisation d’arguments par mot-clé est habituelle en Python. Elle permet de modifier le comportement par défaut de 
nombreuses fonctions. Par exemple, si on souhaite que la fonction print () n’affiche pas un retour à la ligne, on peut utiliser 
l’argument end : 


>>> print ("Message ", end="") 
Message >>> 


Nous verrons, dans le chapitre 20 Fenêtres graphiques et Tkinter, que l’utilisation d'arguments par mot-clé est systéma- 
tique lorsqu’on crée un objet graphique (une fenêtre, un bouton, etc.). 


9.6 Variables locales et variables globales 


Lorsqu’on manipule des fonctions, il est essentiel de bien comprendre comment se comportent les variables. Une variable 
est dite locale lorsqu'elle est créée dans une fonction. Elle n’existera et ne sera visible que lors de l’exécution de ladite 
fonction. 


Une variable est dite globale lorsqu’elle est créée dans le programme principal. Elle sera visible partout dans le pro- 
gramme. 


Ceci ne vous paraît pas clair ? Nous allons prendre un exemple simple qui vous aidera à mieux saisir ces concepts. Observez 
le code suivant : 


# définition d'une fonction carre() 


def carre(x): 
y= x**2 
return y 


# programme principal 
z = 5 

resultat = carre(z) 
print (resultat) 


Pour la suite des explications, nous allons utiliser l’excellent site Python Tutor | qui permet de visualiser l’état des variables 
au fur et à mesure de l’exécution d’un code Python. Avant de poursuivre, nous vous conseillons de prendre 5 minutes pour 
tester ce site. 


Regardons maintenant ce qui se passe dans le code ci-dessus, étape par étape : 


— Étape 1 : Python est prêt à lire la première ligne de code. 


1. http://www.pythontutor.com 
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Python 3.6 Print output (drag lower right corner to resize) 


# définition d'une fonction carre () 
nd def carre (x): 


y = x**2 Frames Objects 


return y 


# programme principal 
Zz = 5 
resultat = carre(z) 


print (resultat) 


— Étape 2 : Python met en mémoire la fonction carre(). Notez qu’il ne l’exécute pas! La fonction est mise dans un 
espace de la mémoire nommé Global frame, il s’agit de l’espace du programme principal. Dans cet espace, seront 
stockées toutes les variables globales créées dans le programme. Python est maintenant prêt à exécuter le programme 
principal. 


Python 3.6 Print output (drag lower right corner to resize) 


# définition d'une fonction carre() 


def carre(x): 


y = x**2 Frames Objects 
one" Global frame function 
carre (x) 


i i carre 
# programme principal 


nd z=5 
resultat = carre(z) 


print (resultat) 


— Etape 3 : Python lit et met en mémoire la variable z. Celle-ci étant créée dans le programme principal, il s’agira d’une 
variable globale. Ainsi, elle sera également stockée dans le Global frame. 


Python 3.6 Print output (drag lower right corner to resize) 


# définition d'une fonction carre() 


al 


def carre(x): 


y = x**2 Frames Objects 
peiura y Global frame function 
carre (x) 
E ý carre 
# programme principal 
z=5 zis 


= resultat = carre(z) 


print (resultat) 


— Étape 4 : La fonction carre() est appelée et on lui passe en argument l’entier z. La fonction s’exécute et un nouveau 
cadre est créé dans lequel Python Tutor va indiquer toutes les variables locales à la fonction. Notez bien que la variable 
passée en argument, qui s’appelle x dans la fonction, est créée en tant que variable locale. On remarquera aussi que les 
variables globales situées dans le Global frame sont toujours 1a. 


Python 3.6 Print output (drag lower right corner to resize) 


# définition d'une fonction carre() 
= def carre (x): 


y = x**2 Frames Objects 
PENER Y Global frame function 
carre (x) 
i i carre 
# programme principal 
z=5 2-5 
resultat = carre (z) 
print (resultat) carre 
xX 5 
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— Étape 5 : Python est maintenant prêt à exécuter chaque ligne de code de la fonction. 


Python 3.6 Print output (drag lower right corner to resize) 


# définition d'une fonction carre() 


def carre(x): 


= y = x**2 Frames Objects 
FORUEN Y Global frame function 
carre (x) 
£ a carre 
# programme principal 
z=5 Zz [5 
resultat = carre(z) 
print (resultat) carre 
xB 


— Etape 6 : La variable y est créée dans la fonction. Celle-ci est donc stockée en tant que variable locale à la fonction. 


Python 3.6 Print output (drag lower right corner to resize) 


# définition d'une fonction carre() 


def carre(x): 


y = x**2 Frames Objects 
-> SERNER: Y Global frame function 
carre (x) 
a $ carre 
# programme principal 
Z = 5) z |5 
resultat = carre(z) 
print (resultat) carre 
x |5 
y |25 


— Etape 7 : Python s’apprête à renvoyer la variable locale y au programme principal. Python Tutor nous indique le 
contenu de la valeur renvoyée. 
Python 3.6 Print output (drag lower right corner to resize) 


# définition d'une fonction carre() 


def carre(x): 


y = x**2 Frames Objects 
Ed eevee Y Global frame function 
carre (x) 
5 è carre 
# programme principal 
z=5 z |5 
resultat = carre(z) 
print (resultat) carre 
XIS 
y |25 
Return 25 


value 


— Étape 8 : Python quitte la fonction et la valeur renvoyée par celle-ci est affectée à la variable globale resultat. Notez 
bien que lorsque Python quitte la fonction, l’espace des variables alloué à la fonction est détruit. Ainsi, toutes les 
variables créées dans la fonction n’existent plus. On comprend pourquoi elles portent le nom de locales puisqu’elles 
n'existent que lorsque la fonction est exécutée. 
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Chapitre 9. Fonctions 


Python 3.6 Print output (drag lower right corner to resize) 


+ définition d'une fonction carre) 
def carre(x): 
y = x**2 


return y 


# programme principal 
z = 5 Zao) 
resultat = carre(z) resultat 25 


=> print (resultat) 


— Etape 9 : Python affiche le contenu de la variable resultat et l'exécution est terminée. 
Python 3.6 Print output (drag lower right corner to resize) 


25 


+ définition d'une fonction carre) 


def carre(x): 


carre (x) 


y = x**2 Frames Objects 
FERRER Y Global frame function 
i i carre 
# programme principal 
z=5 Za 
resultat = carre(z) resultat 25 


print (resultat) 


Frames Objects 


Global frame function 


D carre (x) 
carre 


Nous espérons que cet exemple guidé facilitera la compréhension des concepts de variables locales et globales. Cela 
viendra aussi avec la pratique. Nous irons un peu plus loin sur les fonctions dans le chapitre 12. D’ici là, essayez de vous 


entraîner au maximum avec les fonctions. C’est un concept ardu, mais il est impératif de le maîtriser. 


Enfin, comme vous avez pu le constater, Python Tutor nous a grandement aidé à comprendre ce qui se passait. N’hésitez 
pas à l’utiliser sur des exemples ponctuels, ce site vous aidera à visualiser ce qui se passe lorsqu’un code ne fait pas ce que 


vous attendez. 


9.7 Principe DRY 


L’acronyme DRY ? signifie Don’t Repeat Yourself. Les fonctions permettent de satisfaire ce principe en évitant la duplica- 
tion de code. En effet, plus un code est dupliqué plusieurs fois dans un programme, plus il sera source d’erreurs, notamment 


lorsqu’il faudra le faire évoluer. 


Considérons par exemple le code suivant qui convertit plusieurs températures des degrés Fahrenheit en degrés Celsius : 


>>> temp_in_fahrenheit = 60 

>>> (temp_in_fahrenheit - 32) * (5/8) 
17.5 

>>> temp_in_fahrenheit = 80 

>>> (temp_in_fahrenheit - 32) * (5/8) 
30.0 

>>> temp_in_fahrenheit = 100 

>>> (temp_in_fahrenheit - 32) * (5/8) 
42.5 


Malheureusement il y a une erreur dans la formule de conversion. En effet la formule exacte est : 


temp_celsius = (temp_fahrenheit — 32) x 9 


Il faut alors reprendre les lignes 2, 5 et 8 précédentes et les corriger. Cela n’est pas efficace, surtout si le méme code est 


utilisé 4 différents endroits dans le programme. 


En écrivant qu’une seule fois la formule de conversion dans une fonction, on applique le principe DRY : 


>>> def convert_fahrenheit_to_celsius (temperature): 
return (temperature - 32) * (5/9) 


>>> temp_in_fahrenheit = 60 


2. https: //www.earthdatascience.org/courses/intro-to-earth-data-science/write-efficient-python-code/ 


intro-to-clean-code/dry-modular-code/ 
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>>> convert _fahrenheit_to_celsius(temp_in_fahrenheit) 
15.555555555555557 
>>> temp_in_fahrenheit = 80 


>>> convert_fahrenheit_to_celsius(temp_in_fahrenheit) 
26 .666666666666668 
>>> temp_in_fahrenheit = 100 


>>> convert_fahrenheit_to_celsius(temp_in_fahrenheit) 
37.77777777777778 


Et s’il y a une erreur dans la formule, il suffira de le corriger qu’une seule fois, dans la fonction convert_fahrenheit_to_celsius(). 


9.8 Exercices 


Conseil : pour le premier exercice, utilisez Python Tutor. Pour les exercices suivants, créez des scripts puis exécutez-les 
dans un shell. 


9.8.1 Carré et factorielle 


Reprenez l’exemple précédent à l’aide du site Python Tutor? : 


# définition d'une fonction carre) 
def carre(x): 

y = x**2 

return y 


# programme principal 
z = 5 

resultat = carre(z) 
print (resultat) 


Analysez ensuite le code suivant et tentez de prédire sa sortie : 


def calc_factorielle(n): 


fact = 1 
for i in range(2, n+1): 
fact = fact * i 


return fact 


# programme principal 


nb = 4 

factorielle_nb = calc_factorielle (nb) 
print(f"{nb}! = {factorielle_nb}") 

nb2 = 10 

print (f"{nb2}! = {calc_factorielle(nb2)}") 


Testez ensuite cette portion de code avec Python Tutor en cherchant à bien comprendre chaque étape. Avez-vous réussi à 
prédire la sortie correctement ? 


Remarque 
Une remarque concernant l’utilisation des f-strings que nous avions vues dans le chapitre 3 Affichage. On voit à nou- 
veau une possibilité puissante des f-strings dans l’instruction f"{nb2}! = {calc_factorielle(nb2)}" : il est possible de 


mettre directement au sein des accolades un appel à une fonction (ici {calc_factorielle(nb2)})! Ainsi, pas besoin de 
créer une variable intermédiaire dans laquelle on stocke ce que retourne la fonction. 


9.8.2 Puissance 


Créez une fonction calc_puissance(x, y) qui renvoie x en utilisant l’opérateur **. Pour rappel : 


>>> 2**2 
4 
>>> 2x*x*3 
8 
>>> 2**4 
16 


Dans le programme principal, calculez et affichez à l’écran 2! avec i variant de 0 à 20 inclus. On souhaite que le résultat 
soit présenté avec le formatage suivant : 


3. http: //www.pythontutor.com 
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27 O = 1 
27 1 = 2 
27> 2 = 4 
[...] 


2720 = 1048576 


9.8.3 Pyramide 


Reprenez l’exercice du chapitre 5 Boucles et comparaisons qui dessine une pyramide. 

Dans un script pyra.py, créez une fonction gen_pyramide() à laquelle vous passez un nombre entier N et qui renvoie 
une pyramide de N lignes sous forme de chaîne de caractères. Le programme principal demandera à l'utilisateur le nombre de 
lignes souhaitées (utilisez pour cela la fonction input ()) et affichera la pyramide à l’écran. 


9.8.4 Nombres premiers 


Reprenez l’exercice du chapitre 6 Tests sur les nombres premiers. 

Créez une fonction est_premier () qui prend comme argument un nombre entier positif n (supérieur à 2) et qui renvoie le 
booléen True si n est premier et False si n n’est pas premier. Déterminez tous les nombres premiers de 2 à 100. On souhaite 
avoir une sortie similaire à celle-ci : 


2 est premier 
3 est premier 
4 n'est pas premier 


[ 


100 n'est pas premier 


9.8.5 Séquence complémentaire 


Créez une fonction seq_comp() qui prend comme argument une liste de bases et qui renvoie la séquence complémentaire 
d’une séquence d’ ADN sous forme de liste. 

Dans le programme principal, à partir de la séquence d'ADN seq = ["A", "T", "C", "G", "A", "T", "C", "G", 
"A", "T", "C"] affichez seq et sa séquence complémentaire (en utilisant votre fonction seq_comp()). 

Rappel : la séquence complémentaire s’obtient en remplaçant A par T, T par A, C par G et G par C. 


9.8.6 Distance 3D 


Créez une fonction calc_distance_3D() qui calcule la distance euclidienne en trois dimensions entre deux atomes. 
Testez votre fonction sur les 2 points A(0,0,0) et B(1,1,1). Trouvez-vous bien 3? 

On rappelle que la distance euclidienne d entre deux points A et B de coordonnées cartésiennes respectives (x4,ya,Za) et 
(xB, yB, ZB) se calcule comme suit : 


d= yx) + (yp —ya)? + (zp — za)? 


9.8.7 Distribution et statistiques 


Créez une fonction gen_distrib() qui prend comme argument trois entiers : debut, fin et n. La fonction renverra une 
liste de n floats aléatoires entre debut et fin. Pour générer un nombre aléatoire dans un intervalle donné, utilisez la fonction 
uniform() du module random dont voici quelques exemple d’utilisation : 


>>> import random 


>>> random.uniform(1, 10) 
8.199672607202174 


>>> random.uniform(1, 10) 
2.607528561528022 
>>> random.uniform(1, 10) 
9.000404025130946 


Avec la fonction random.uniform(), les bornes passées en argument sont incluses, c’est-à-dire qu’ici, le nombre aléa- 
toire renvoyé est dans l’intervalle [1, 10]. 

Créez une autre fonction calc_stat () qui prend en argument une liste de floats et qui renvoie une liste de trois éléments 
contenant respectivement le minimum, le maximum et la moyenne de la liste. 
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1.0 


0.5 


sin(x) 
0.0 


-0.5 


-1.0 


FIGURE 9.2 — Illustration de la distance à l’origine. 


Dans le programme principal, générez 20 listes aléatoires de 100 floats compris entre 0 et 100 et affichez le minimum 
(min()), le maximum (max ()) et la moyenne pour chacune d’entre elles. La moyenne pourra être calculée avec les fonctions 
sum() et len(). 

Pour chacune des 20 listes, affichez les statistiques (min, max, et moyenne) avec deux chiffres après la virgule : 


Liste 1 : min = 0.17 ; max = 99.72 ; moyenne = 57.38 
Liste 2 : min = 1.25 ; max = 99.99 ; moyenne = 47.41 
Esos] 

Liste 19 : min = 1.05 ; max = 99.36 ; moyenne = 49.43 
Liste 20 : min = 1.33 ; max = 97.63 ; moyenne = 46.53 


Les écarts sur les statistiques entre les différentes listes sont-ils importants ? Relancez votre script avec des listes de 1000 
éléments, puis 10 000 éléments. Les écarts changent-ils quand le nombre d’éléments par liste augmente ? 


9.8.8 Distance à l’origine (exercice +++) 


En reprenant votre fonction de calcul de distance euclidienne en 3D calc_distance_3D(), faites-en une version pour 
deux dimensions que vous appellerez calc_distance_2D(). 

Créez une autre fonction calc_dist2ori() à laquelle vous passez en argument deux listes de floats list_x et list_y 
représentant les coordonnées d’une fonction mathématique (par exemple x et sin(x)). Cette fonction renverra une liste de floats 
représentant la distance entre chaque point de la fonction et l’origine (de coordonnées (0,0)). 

La figure 9.2 montre un exemple sur quelques points de la fonction sin(x) (courbe en trait épais). Chaque trait pointillé 
représente la distance que l’on cherche à calculer entre les points de la courbe et l’origine du repère de coordonnées (0, 0). 

Votre programme générera un fichier sin2ori.dat qui contiendra deux colonnes : la première représente les x, la seconde 
la distance entre chaque point de la fonction sin(x) à l’origine. 

Enfin, pour visualiser votre résultat, ajoutez le code suivant tout à la fin de votre script : 


# création d'une image pour la visualisation du résultat 
import matplotlib.pyplot as plt 


[] 
[] 


x 
y 
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with open("sin2ori.dat", "r") as f_in: 


plt. 
.plot(x, y) 
plt. 
plt. 
plt. 


plt 


for line in f_in: 
coords = line.split() 
x.append(float (coords [0])) 
y.append (float (coords [1])) 
figure(figsize=(8,8)) 


xlabel ("x") 
ylabel("Distance de sin(x)à l'origine") 
savefig("sin2ori.png") 


Ouvrez l’image sin2ori. png. 


Remarque 


Le module matplotlib sera expliqué en détail dans le chapitre 17 Quelques modules d'intérêt en bioinformatique. 
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Chapitre 10 


Plus sur les chaînes de caracteres 


10.1 Préambule 


Nous avons déjà abordé les chaînes de caractères dans les chapitres 2 Variables et 3 Affichage. Ici nous allons un peu plus 


loin, notamment avec les méthodes associées aux chaînes de caractères !. 


10.2 Chaînes de caractères et listes 


Les chaînes de caractères peuvent être considérées comme des listes (de caractères) un peu particulières : 


>>> animaux = "girafe tigre" 
>>> animaux 

"girafe tigre ' 

>>> len(animaux) 

12 

>>> animaux [3] 

ta! 


Nous pouvons donc utiliser certaines propriétés des listes comme les tranches : 


>>> animaux = "girafe tigre" 
>>> animaux [0:4] 

'gira' 

>>> animaux [9:] 

'gre 1 

>>> animaux [:-2] 

'girafe tig' 

>>> animaux [1:-2:2] 

‘iaetg' 


Mais a contrario des listes, les chaînes de caractères présentent toutefois une différence notable, ce sont des listes non 
modifiables. Une fois une chaîne de caractères définie, vous ne pouvez plus modifier un de ses éléments. Le cas échéant, 
Python renvoie un message d’erreur : 


>>> animaux = "girafe tigre" 
>>> animaux [4] 
'f! 
>>> animaux[4] = "F" 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: 'str' object does not support item assignment 


Par conséquent, si vous voulez modifier une chaine de caractéres, vous devez en construire une nouvelle. Pour cela, 
n'oubliez pas que les opérateurs de concaténation (+) et de duplication (+) (introduits dans le chapitre 2 Variables) peuvent 
vous aider. Vous pouvez également générer une liste, qui elle est modifiable, puis revenir à une chaîne de caractères (voir plus 
bas). 


1. https://docs.python.org/fr/3/library/string. html 
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10.3 Caractères spéciaux 


Il existe certains caractères spéciaux comme \n que nous avons déjà vu (pour le retour à la ligne). Le caractère \t produit 
une tabulation. Si vous voulez écrire des guillemets simples ou doubles et que ceux-ci ne soient pas confondus avec les 
guillemets de déclaration de la chaîne de caractères, vous pouvez utiliser \' ou \". 


>>> print ("Un retour à la ligne\npuis une tabulation\t puis un guillemet\"") 
Un retour a la ligne 

puis une tabulation puis un guillemet" 

>>> print('J\'affiche un guillemet simple') 

J'affiche un guillemet simple 


Vous pouvez aussi utiliser astucieusement des guillemets doubles ou simples pour déclarer votre chaîne de caractères : 


>>> print("Un brin d'ADN") 

Un brin d'ADN 

>>> print('Python est un "super" langage de programmation) 
Python est un "super" langage de programmation 


Quand on souhaite écrire un texte sur plusieurs lignes, il est très commode d’ utiliser les guillemets triples qui conservent 
le formatage (notamment les retours 4 la ligne) : 


>>> x = """souris 
chat 
abeille""" 
>>> x 
‘souris\nchat\nabeille' 
>>> print (x) 
souris 
chat 
abeille 


Attention, les caractères spéciaux n’apparaissent intérprétés que lorsqu’ils sont utilisés avec la fonction print (). Par 
exemple, le \n n’apparait comme un saut de ligne que lorsqu’il est dans une chaine de caractéres passée a la fonction print () : 


>>> "bla\nbla" 
'bla\nbla' 

>>> print ("bla\nbla") 
bla 

bla 


10.4 Préfixe de chaîne de caractères 


Nous avons vu au chapitre 3 la notion de f-string. Il s’agit d’un mécanisme pour formater du texte au sein d’une chaîne de 
caractères. Par exemple : 


>>> var = "f-string" 
>>> f"voici une belle {var}" 
‘voici une belle f-string' 


Que signifie le f que l’on accole aux guillements de la chaîne de caractères ? Celui-ci est appelé « préfixe de chaîne de 
caractères » ou stringprefix. 


Remarque 


Un stringprefix modifie la manière dont Python va interpréter la dite string. Celui-ci doit être systématiquement « collé » 
à la chaîne de caractères, c’est-à-dire pas d’espace entre les deux. 


Il existe différents stringprefixes en Python, nous vous montrons ici les deux qui nous apparaissent les plus importants. 
— Le préfixe r mis pour raw string qui force la non-interprétation des caractères spéciaux : 


>>> s = "Voici un retour à la ligne\nEt lá une autre ligne" 
>>> s 

‘Voici un retour à la ligne\nEt lá une autre ligne 
>>> print (s) 

Voici un retour à la ligne 

Et 14 une autre ligne 

>>> s = r"Voici un retour à la ligne\nEt là une autre ligne" 
>>> s 

"Voici un retour à la ligne\\nEt lá une autre ligne' 

>>> print (s) 

Voici un retour à la ligne\nEt lá une autre ligne 
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L’ajout du r va forcer Python à ne pas interpréter le \n comme un retour à la ligne, mais comme un backslash littéral 
suivi d’un n. Quand on demande à l’interpréteur d’afficher cette chaîne de caractères, celui-ci met deux backslashes pour 
signifier qu'il s’agit d’un backslash littéral (le premier échappe le second). Finalement, l’utilisation de la syntaxe r"Voici 
un retour à la ligne\nEt lá une autre ligne" renvoie une chaîne de caractères normale, puisqu’on voit ensuite 
que le r à disparu lorsqu'on demande à Python d’afficher le contenu de la variable s. Comme dans var = 2 + 2, d’abord 
Python évalue 2 + 2 et c’est ce résultat qui est affecté à la variable var. Enfin, on notera que seule l’utilisation du print O 
mène à l’interprétation des caractères spéciaux comme \n, comme expliqué dans la rubrique précédente. 

Les caractères spéciaux non interprétés dans les raw strings sont de manière générale tout ce dont le backslash modifie la 
signification, par exemple un \n, un \t, etc. 

— Le préfixe f mis pour formatted string qui met en place l’écriture formattée comme vue au chapitre 3 Affichage : 


>>> animal = "renard" 

>>> animal2 = "poulain" 

>>> s = f"Le {animal} est un animal gentil\nLe {animal2} aussi" 
>>> s 


‘Le renard est un animal gentil\nLe poulain aussi 


>>> print(s) 

Le renard est un animal gentil 

Le poulain aussi 

>>> s = "Le {animal} est un animal gentil\nLe {animal2} aussi" 
>>> s 

‘Le {animal} est un animal gentil\nLe {animal2} aussi 

>>> print(s) 

Le {animal} est un animal gentil 

Le {animal2} aussi 


La f-string remplace le contenu des variables situées entre les accolades et interprète le \n comme un retour à la ligne. 
Pour rappel, consultez le chapitre 3 si vous souhaitez plus de détails sur le fonctionnement des f-strings. 


Conseil 
Il existe de nombreux autres détails concernant les préfixes qui vont au delà de ce cours. Pour en savoir plus, vous pouvez 
consulter la documentations officielle ?. 


10.5 Méthodes associées aux chaînes de caractères 


Voici quelques méthodes ° spécifiques aux objets de type str : 


>>> x = "girafe" 
>>> x.upper() 

' GIRAFE ' 

>>> x 
'girafe 
>>> 'TIGRE'.lower() 
'tigre' 


Les méthodes . lower () et .upper () renvoient un texte en minuscule et en majuscule respectivement. On remarque que 
l’utilisation de ces méthodes n’altère pas la chaîne de caractères de départ mais renvoie une chaîne de caractères transformée. 
Pour mettre en majuscule la première lettre seulement, vous pouvez faire : 


>>> x[O].upper() + x[1:] 
'Girafe' 


ou plus simplement utiliser la méthode adéquate : 


>>> x.capitalize() 
'Girafe' 


Il existe une méthode associée aux chaînes de caractères qui est particulièrement pratique, la méthode .splitO : 


>>> animaux = "girafe tigre singe souris" 
>>> animaux.split() 
['girafe', 'tigre', 'singe', 'souris'] 


>>> for animal in animaux.split(): 
print(animal) 


2. https: //docs.python.org/fr/3/reference/lexical_analysis.htmltgrammar-token-stringprefix 
3. https: //docs.python.org/fr/3/library/string.html 
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girafe 
tigre 
singe 
souris 
La méthode .split() découpe une chaîne de caractères en plusieurs éléments appelés champs, en utilisant comme sépa- 


rateur n’importe quelle combinaison « d’espace(s) blanc(s) ». 


Définition 
Un espace blanc * (whitespace en anglais) correspond aux caractères qui sont invisibles à l’œil, mais qui occupent de 
l’espace dans un texte. Les espaces blancs les plus classiques sont l’espace, la tabulation et le retour à la ligne. 


Il est possible de modifier le séparateur de champs, par exemple : 


>>> animaux = "girafe:tigre:singe::souris" 
>>> animaux.split(":") 
['girafe', 'tigre', 'singe', '', 'souris'] 


Attention, dans cet exemple, le séparateur est un seul caractéres « : » (et non pas une combinaison de un ou plusieurs :) 
conduisant ainsi à une chaîne vide entre singe et souris. 

Il est également intéressant d’indiquer à . split () le nombre de fois qu’on souhaite découper la chaîne de caractères avec 
l’argument maxsplit : 


>>> animaux = "girafe tigre singe souris" 
>>> animaux.split (maxsplit=1) 

['girafe', 'tigre singe souris] 

>>> animaux.split (maxsplit=2) 

['girafe', 'tigre', 'singe souris] 


La méthode .find(), quant à elle, recherche une chaîne de caractères passée en argument : 


>>> animal = "girafe" 


>>> animal.find("i") 
1 


>>> animal.find("afe") 
3 


>>> animal.find("z") 
-1 
>>> animal.find("tig") 
-1 
Si l élément recherché est trouvé, alors l’indice du début de l’élément dans la chaîne de caractères est renvoyé. Si l élément 
n’est pas trouvé, alors la valeur -1 est renvoyée. 


Si l’élément recherché est trouvé plusieurs fois, seul l’indice de la première occurrence est renvoyé : 


>>> animaux = "girafe tigre" 
>>> animaux.find("i") 
{ 


On trouve aussi la méthode .replace() qui substitue une chaîne de caractères par une autre : 


>>> animaux = "girafe tigre" 

>>> animaux.replace("tigre", "singe") 
'girafe singe ' 

>>> animaux.replace("i", "o") 

'gorafe togre' 


La méthode .count () compte le nombre d’occurrences d’une chaîne de caractères passée en argument : 


>>> animaux = "girafe tigre" 
>>> animaux. count ("i") 

2 

>>> animaux.count ("z") 

0 

>>> animaux.count ("tigre") 

1 


La méthode .startswith() vérifie si une chaîne de caractères commence par une autre chaîne de caractères : 


>>> chaine = "Bonjour monsieur le capitaine !" 
>>> chaine.startswith ("Bonjour") 
True 


>>> chaine.startswith("Au revoir") 
False 


4. https://en.wikipedia.org/wiki/Whitespace_ character 
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Cette méthode est particulièrement utile lorsqu’on lit un fichier et que l’on veut récupérer certaines lignes commençant 
par un mot-clé. Par exemple dans un fichier PDB, les lignes contenant les coordonnées des atomes commencent par le mot-clé 
ATOM. 

Enfin, la méthode .strip() permet de « nettoyer les bords » d’une chaîne de caractères : 


>>> chaine = " Comment enlever les espaces au début et à la fin ? Wy 
>>> chaine.strip() 
Comment enlever les espaces au début et à la fin ?' 


La méthode .strip() enlève les espaces situés sur les bords de la chaîne de caractère mais pas ceux situés entre des 
caractères visibles. En réalité, cette méthode enlève n’importe quel combinaison « d’espace(s) blanc(s) » sur les bords, par 
exemple : 


>>> chaine = \tfonctionne avec les tabulations et les retours à la ligne\n" 
>>> chaine.strip() 
"fonctionne avec les tabulations et les retours à la ligne' 


La méthode .strip() est trés pratique quand on lit un fichier et qu’on veut se débarrasser des retours 4 la ligne. 


10.6 Extraction de valeurs numériques d’une chaine de caractéres 


Une tache courante en Python est de lire une chaine de caractéres (provenant par exemple d’un fichier), d’extraire des 
valeurs de cette chaine de caractéres pour ensuite les manipuler. 
On considère par exemple la chaîne de caractères val : 


>>> val = "3.4 17.2 atom" 


On souhaite extraire les valeurs 3.4 et 17.2 pour ensuite les additionner. 
Dans un premier temps, on découpe la chaîne de caractères avec la méthode .split () : 


>>> val2 = val.split() 
>>> val2 
['3.4', '17.2', 'atom'] 


On obtient alors une liste de chaines de caractéres. On transforme ensuite les deux premiers éléments de cette liste en 
floats (avec la fonction float ()) pour pouvoir les additionner : 


>>> float(val2[0]) + float(val2[1]) 
20.599999999999998 


Remarque 


Retenez bien l’utilisation des instructions précédentes pour extraire des valeurs numériques d’une chaîne de caractères. 
Elles sont régulièrement employées pour analyser des données extraites d’un fichier. 


10.7 Conversion d’une liste de chaînes de caractères en une chaîne de caractères 


On a vu dans le chapitre 2 Variables la conversion d’un type simple (entier, float et chaîne de caractères) en un autre avec 
les fonctions int (), float () et str(). La conversion d’une liste de chaînes de caractères en une chaîne de caractères est 
particulière puisqu'elle fait appelle à la méthode . join(). 

>>> seq = ETA", Tes Gu "A", "TaJ 
>>> seq 

FAS, WES LG ty 'A', CT] 

>>> "-",join(seq) 

'A-T-G-A-T' 

>>> " ",join(seq) 

'ATGAT' 


>>> "",join(seq) 
"ATGAT ' 


Les éléments de la liste initiale sont concaténés les uns à la suite des autres et intercalés par un séparateur qui peut être 
n’importe quelle chaîne de caractères. Ici, on a utilisé un tiret, un espace et rien (une chaîne de caractères vide). 
Attention, la méthode . join() ne s’applique qu’à une liste de chaînes de caractères. 
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>>> maliste = ["A", 5, 
>>> " ",join(maliste) 
Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
TypeError: sequence item 1: expected string, 


"G"] 


int found 


On espère qu’aprés ce petit tour d'horizon vous serez convaincu de la richesse des méthodes associées aux chaînes de 
caractères. Pour avoir une liste exhaustive de l’ensemble des méthodes associées à une variable particulière, vous pouvez 


utiliser la fonction dir(). 


>>> animaux = "girafe tigre" 
>>> dir(animaux) 


['__add__', '__class__', '__contains__', __delattr__', '__dir_ 
'__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', 
_getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', 
_init_subclass__', '__iter__' "__le__ Len." Lt..." 
d__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__ 
s "¿repr ty "armod "mul. * '__setattr__', '__sizeof__ 
'__str__', '__subclasshook__', 'capitalize', 'casefold', 'center' 
'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 
mat_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 
sidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 
title', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans 
'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition 
'rsplit', 'rstrip', 'split', 'splitlines', 'startewith', 'strip' 
'swapcase', 'title', 'translate', 'upper', 'zfil1'] 


> 


, 


"for 


va: 
is 
Y 

; 
; 


Pour l’instant, vous pouvez ignorer les méthodes qui commencent et qui se terminent par deux tirets bas (underscores) __. 
Vous pouvez également accéder à l’aide et à la documentation d’une méthode particulière avec help (), par exemple pour 


la méthode .split () : 


>>> help(animaux.split) 
Help on built-in function split: 


split (...) 
S.split([sep [,maxsplit]]) -> list of strings 
Return a list of the words in the string S, using sep as the 
delimiter string. If maxsplit is given, at most maxsplit 
splits are done. If sep is not specified or is None, any 
whitespace string is a separator. 

(END) 


Attention à ne pas mettre les parenthèses à la suite du nom de la méthode. L’instruction correcte est help (animaux. split) 


et non pas help (animaux.splitO). 


10.8 Exercices 


Conseil : pour ces exercices, créez des scripts puis exécutez-les dans un shell. 


10.8.1 Parcours d’une liste de chaînes de caractères 


Soit la liste ['girafe', 'tigre', 'singe', 'souris']. Avec une boucle, affichez chaque élément ainsi que sa taille 


(nombre de caractères). 


10.8.2 Lecture d’une séquence à partir d’un fichier FASTA 


Le fichier UBI4_SCerevisiae.fasta” contient une séquence d’ ADN au format FASTA. 

Créez une fonction 1it_fasta() qui prend comme argument le nom d’un fichier FASTA sous la forme d’une chaîne de 
caractères, lit la séquence dans le fichier FASTA et la renvoie sous la forme d’une chaîne de caractères. 

Utilisez ensuite cette fonction pour récupérer la séquence d' ADN dans la variable sequence puis pour afficher les infor- 


mations suivantes : 

le nom du fichier FASTA, 

la longueur de la séquence (c’est-à-dire le nombre de bases qu’ elle contient), 
un message vérifiant que le nombre de base est (ou non) un multiple de 3, 

le nombre de codons (on rappelle qu’un codon est un bloc de 3 bases), 


5. https://python.sdv.univ-paris-diderot.fr/data-files/UBI4 SCerevisiae.fasta 
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— les 10 premières bases, 
— les 10 dernières bases. 
La sortie produite par le script devrait ressembler à ça : 


UBI4_SCerevisiae.fasta 

La séquence contient WWW bases 

La longueur de la séquence est un multiple de 3 nucléotides 

La séquence possède XXX codons 

10 premières bases : YYYYYYYYYY 

10 dernières bases : ZZZZZZZZZZ 

où WWW et XXX sont des entiers et YYYYYYYYYY et ZZZZZZZZZZ sont des bases. 

Conseil : vous trouverez des explications sur le format FASTA et des exemples de code dans l’annexe À Quelques formats 


de données rencontrés en biologie. 


10.8.3 Fréquence des bases dans une séquence d’ADN 


Soit la séquence d'ADN ATATACGGATCGGCTGTTGCCTGCGTAGTAGCGT. On souhaite calculer la fréquence de chaque base 
A, T, C et G dans cette séquence et afficher le résultat à l’écran. 

Créez pour cela une fonction calc_composition() à laquelle vous passez en argument votre séquence d’ADN sous 
forme d’une chaîne de caractères et qui renvoie une liste de quatre floats indiquant respectivement la fréquence en bases A, T, 
GetC. 


10.8.4 Conversion des acides aminés du code à trois lettres au code à une lettre 


Créez une fonction convert _3_lettres_1_lettre() qui prend en argument une chaîne de caractères avec des acides 
aminés en code à trois lettres et renvoie une chaîne de caractères avec les acides aminés en code à 1 lettre. 

Utilisez cette fonction pour convertir la séquence protéique 
ALA GLY GLU ARG TRP TYR SER GLY ALA TRP. 

Rappel de la nomenclature des acides aminés : 


Acide aminé Code 3-lettres Code 1-lettre 


Alanine Ala A 
Arginine Arg R 
Asparagine Asn N 
Aspartate Asp D 
Cystéine Cys C 
Glutamate Glu E 
Glutamine Gin Q 
Glycine Gly G 
Histidine His H 
Isoleucine Ile I 
Leucine Leu L 
Lysine Lys K 
Méthionine Met M 
Phénylalanine Phe F 
Proline Pro P 
Sérine Ser S 
Thréonine Thr T 
Tryptophane Trp W 
Tyrosine Tyr Y 
Valine Val V 
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10.8.5 Distance de Hamming 


La distance de Hamming © mesure la différence entre deux séquences de même taille en comptant le nombre de positions 
qui, pour chaque séquence, ne correspondent pas au méme acide aminé. 

Créez la fonction dist_hamming() qui prend en argument deux chaines de caractéres et qui renvoie la distance de 
Hamming (sous la forme d’un entier) entre ces deux chaînes de caractères. 

Calculez la distance de Hamming entre les séquences 
AGWPSGGASAGLATL et IGWPSAGASAGLWIL 
puis entre les séquences 
ATTCATACGTTACGATT et ATACTTACGTAACCATT. 


10.8.6 Palindrome 


Un palindrome est un mot ou une phrase dont l’ordre des lettres reste le même si on le lit de gauche à droite ou de droite 
a gauche. Par exemple, « ressasser » et « engage le jeu que je le gagne » sont des palindromes. 

Créez la fonction test_palindrome() qui prend en argument une chaîne de caractères et qui affiche xxx est un 
palindrome si la chaîne de caractères xxx passée en argument est un palindrome ou xxx n'est pas un palindrome 
sinon. Pensez à vous débarrasser au préalable des majuscules et des espaces. 

Testez ensuite si les expressions suivantes sont des palindromes : 

— radar 

— never odd or even 

— karine alla en Iran 

— un roc si biscornu 


10.8.7 Mot composable 


Un mot est composable à partir d’une séquence de lettres si la séquence contient toutes les lettres du mot. Chaque lettre de 
la séquence ne peut être utilisée qu’une seule fois. Par exemple, « coucou » est composable à partir de « uocuoceokzefhu ». 

Écrivez la fonction test_composable() qui prend en argument un mot (sous la forme d’une chaîne de caractères) et 
une séquence de lettres (aussi comme une chaîne de caractères) et qui affiche Le mot xxx est composable à partir 
de yyy si le mot (xxx) est composable à partir de la séquence de lettres (yyy) ou Le mot xxx n'est pas composable à 
partir de yyy sinon. 

Testez cette fonction avec les mots et les séquences suivantes : 


Mot Séquence 


python aophrtkny 
python aeiouyhpq 
coucou uocuoceokzezh 
fonction nhwfnitvkloco 


10.8.8 Alphabet et pangramme 


Les codes ASCII des lettres minuscules de Il’ alphabet vont de 97 (lettre « a ») à 122 (lettre « z »). La fonction chr () prend 
en argument un code ASCII sous la forme d’un entier et renvoie le caractére correspondant (sous la forme d’une chaine de 
caractères). Ainsi chr (97) renvoie 'a', chr(98) renvoie 'b' et ainsi de suite. 

Créez la fonction get_alphabet () qui utilise une boucle et la fonction chr () et qui renvoie une chaîne de caractères 
contenant toutes les lettres de l’alphabet. 

Un pangramme ” est une phrase comportant au moins une fois chaque lettre de I’ alphabet. Par exemple, « Portez ce vieux 
whisky au juge blond qui fume » est un pangramme. 

Créez la fonction pangramme() qui utilise la fonction get_alphabet () précédente, qui prend en argument une chaîne 
de caractères (xxx) et qui renvoie xxx est un pangramme si cette chaîne de caractères est un pangramme ou xxx n'est 
pas un pangramme sinon. Pensez à vous débarrasser des majuscules le cas échéant. 


6. https://fr.wikipedia.org/wiki/Distance_de_Hamming 
7. http://fr.wikipedia.org/wiki/Pangramme 
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Testez ensuite si les expressions suivantes sont des pangrammes : 

— Portez ce vieux whisky au juge blond qui fume 

— Monsieur Jack vous dactylographiez bien mieux que votre ami Wolf 
— Buvez de ce whisky que le patron juge fameux 


10.89 Lecture d’une séquence à partir d’un fichier GenBank (exercice +++) 


On cherche à récupérer la séquence d’ADN du chromosome I de la levure Saccharomyces cerevisiae contenu dans le 
fichier au format GenBank NC_001133.gbk*. 

Le format GenBank est présenté en détails dans l’annexe A Quelques formats de données rencontrés en biologie. Pour cet 
exercice, vous devez savoir que la séquence démarre après la ligne commençant par le mot ORIGIN et se termine avant la ligne 
commençant par les caractères // : 


ORIGIN 


1 
61 

amal 
230101 
230161 


ccacaccaca 
catcctaaca 


tgttagtgtt 
ggtgtgggtg 


cccacacacc 
ctaccctaac 


agtattaggg 
tgggtgtggt 


cacacaccac 
acagccctaa 


tgtggtgtgt 
gtggtgtgtg 


accacacacc 
tctaaccctg 


gggtgtggtg 
ggtgtggtgt 


acaccacacc 
gccaacctgt 


tgggtgtggg 
gggtgtggtg 


cacacacaca 
ctctcaactt 


tgtgggtgtg 
tgtgtggg 


// 


Pour extraire la séquence d'ADN, nous vous proposons d’utiliser un algorithme de « drapeau », c’est-à-dire une variable 
qui sera a True lorsqu’on lira les lignes contenant la séquence et 4 False pour les autres lignes. 

Créez une fonction 1it_genbank() qui prend comme argument le nom d’un fichier GenBank sous la forme d’une chaîne 
de caractères, lit la séquence dans le fichier GenBank et la renvoie sous la forme d’une chaîne de caractères. 

Utilisez ensuite cette fonction pour récupérer la séquence d’ ADN dans la variable sequence dans le programme principal. 
Le script affichera : 


NC_001133.gbk 

La séquence contient XXX bases 

10 premières bases YYYYYYYYYY 
10 dernières bases ZZZZZZZZZZ 


où XXX est un entier et YYYYYYYYYY et ZZZZZZZZZZ sont des bases. 
Vous avez toutes les informations pour effectuer cet exercice. Si toutefois vous coincez sur la mise en place du drapeau, 
voici l’ algorithme en pseudo-code pour vous aider : 


drapeau <- Faux 
seq <- chaîne de caractères vide 
Lire toutes les lignes du fichier: 
si la ligne contient //: 
drapeau <- Faux 
si drapeau est Vrai: 
on ajoute à seq la ligne (sans espace, 
si la ligne contient ORIGIN: 
drapeau <- Vrai 


chiffre et retour à la ligne) 


10.8.10 Affichage des carbones alpha d’une structure de protéine 


Téléchargez le fichier 1bta.pdb° qui correspond à la structure tridimensionnelle de la protéine barstar !° sur le site de la 
Protein Data Bank (PDB). 

Créez la fonction trouve_calpha() qui prend en argument le nom d’un fichier PDB (sous la forme d’une chaîne de 
caractères), qui sélectionne uniquement les lignes contenant des carbones alpha, qui stocke ces lignes dans une liste et les 
renvoie sous la forme d’une liste de chaînes de caractères. 

Utilisez la fonction trouve_calpha() pour afficher à l’écran les carbones alpha des deux premiers résidus (acides ami- 
nés). 

Conseil : vous trouverez des explications sur le format PDB et des exemples de code pour lire ce type de fichier en Python 
dans l’annexe A Quelques formats de données rencontrés en biologie. 


8. https://python.sdv.univ-paris-diderot.fr/data-files/NC_001133.gbk 
9. https://files.rcsb.org/download/1BTA.pdb 
10. http://www.rcsb.org/pdb/explore.do?structureld=1BTA 


86 Cours de Python / Université de Paris / UFR Sciences du Vivant 


10.8. Exercices Chapitre 10. Plus sur les chaînes de caractères 


10.8.11 Calcul des distances entre les carbones alpha consécutifs d’une structure de protéine 
(exercice +++) 


En utilisant la fonction trouve _calpha() précédente, calculez la distance interatomique entre les carbones alpha des 
deux premiers résidus (avec deux chiffres après la virgule). 

Rappel : la distance euclidienne d entre deux points A et B de coordonnées cartésiennes respectives (x4,y4,z4) et 
(xB, yB,28) se calcule comme suit : 


d= Vs —xa)* + (ys — ya)? + (28 — 2a)? 


Créez ensuite la fonction calcule_distance() qui prend en argument la liste renvoyée par la fonction trouve_calpha(), 
qui calcule les distances interatomiques entre carbones alpha consécutifs et affiche ces distances sous la forme : 

numero_calpha_1 numero_calpha_2 distance 

Les numéros des carbones alpha seront affichés sur 2 caractères. La distance sera affichée avec deux chiffres après la 
virgule. Voici un exemple avec les premiers carbones alpha : 


1 2 3.80 
2 3 3.80 
3 4 3.83 
4 5 3.82 


Modifiez maintenant la fonction calcule _distance() pour qu’elle affiche à la fin la moyenne des distances. 

La distance inter-carbone alpha dans les protéines est très stable et de l’ordre de 3,8 angstrôms. Observez avec attention 
les valeurs que vous avez calculées pour la protéine barstar. Repérez une valeur surprenante. Essayez de l’expliquer. 

Conseil : vous trouverez des explications sur le format PDB et des exemples de code pour lire ce type de fichier en Python 
dans l’annexe A Quelques formats de données rencontrés en biologie. 


10.8.12 Compteur de gènes dans un fichier GenBank 


Dans cet exercice, on souhaite compter le nombre de gènes du fichier GenBank NC_001133.gbk !! (chromosome I de la 
levure Saccharomyces cerevisiae) et afficher la longueur de chaque gène. Pour cela, il faudra récupérer les lignes décrivant la 
position des gènes. Voici par exemple les cinq premières lignes concernées dans le fichier NC_001133.gbk : 


gene complement (<1807..>2169) 
gene <2480..>2707 

gene complement (<7235..>9016) 
gene complement (<11565..>11951) 
gene <12046..>12426 


Éd 


Lorsque la ligne contient le mot complement le gène est situé sur le brin complémentaire, sinon il est situé sur le brin 
direct. Votre code devra récupérer le premier et le second nombre indiquant respectivement la position du début et de fin du 
gène. Attention à bien les convertir en entier afin de pouvoir calculer la longueur du gène. Notez que les caractères > et < 
doivent être ignorés, et les . . servent à séparer la position de début et de fin. 

On souhaite obtenir une sortie de la forme : 


gène 1 complémentaire -> 362 bases 
géne 2 direct -> 227 bases 
gène 3 complémentaire -> 1781 bases 
[...] 

gène 99 direct => 611 bases 
gene 100 direct => 485 bases 
gène 101 direct -> 1403 bases 


Conseil : vous trouverez des explications sur le format GenBank dans l’annexe A Quelques formats de données rencontrés 
en biologie. 


11. https://python.sdv.univ-paris-diderot.fr/data-files/NC_001133.gbk 
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Chapitre 11 


Plus sur les listes 


Nous avons vu les listes dès le chapitre 4 et les avons largement utilisées depuis le début de ce cours. Dans ce chapitre 
nous allons plus loin avec les méthodes associées aux listes, ainsi que d’autres caractéristiques très puissantes telles que les 
tests d’appartenance ou les listes de compréhension. 


11.1 Méthodes associées aux listes 


Comme pour les chaînes de caractères, les listes possèdent de nombreuses méthodes qui leur sont propres et qui peuvent 
se révéler très pratiques. On rappelle qu’une méthode est une fonction qui agit sur l’objet auquel elle est attachée par un point. 


11.1.1 .append() 


La méthode . append(), que l’on a déjà vu au chapitre 4 Listes, ajoute un élément à la fin d’une liste : 


>>> a = [1, 2, 3] 
>>> a.append (5) 
>>> a 

[1, 2, 3, 5] 


qui est équivalent à : 


>>> a = [1, 2, 3] 
>>> a = a + [5] 
>>> a 

[1, 2, 3, 5] 


Conseil : préférez la version avec .append() qui est plus compacte et facile à lire. 


11.1.2 .insert() 


La méthode .insert () insère un objet dans une liste à un indice déterminé : 


>>> a = [1, 2, 3] 

>>> a.insert(2, -15) 

>>> a 

[1, 2, -15, 3] 
11.1.3 del 


L'instruction del supprime un élément d’une liste à un indice déterminé : 


>>> a = [1, 2, 3] 
>>> del a[1] 

>>> a 

[1, 3] 


Remarque 
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Contrairement aux méthodes associées aux listes présentées dans cette rubrique, del est une instruction générale de Py- 
thon, utilisable pour d’autres objets que des listes. Celle-ci ne prend pas de parenthèse. 


11.1.4 .remove() 


La méthode .remove() supprime un élément d’une liste à partir de sa valeur : 


>>> a = [1, 2, 3] 
>>> a.remove (3) 
>>> a 


[1, 2] 


S’il y a plusieurs fois la même valeur dans la liste, seule la première est retirée. Il faut appeler la méthode . remove () 
autant de fois que nécessaire pour retirer toutes les occurences d’un méme élément : 


>>> a = [1, 2, 3, 4, 3] 
>>> a.remove (3) 
>>> a 


[1, 2, 4, 3] 
>>> a.remove (3) 
>>> a 


[1, 2, 4] 


11.1.5 .sort() 


La méthode .sort() trie les éléments d’une liste du plus petit au plus grand : 


>>> a = [3, 1, 2] 
>>> a.sort () 

>>> a 

[1, 2, 3] 


L'argument reverse=True spécifie le tri inverse, c’est-à-dire du plus grand au plus petit élément : 


>>> a = [3, 1, 2] 

>>> a.sortí(reverse=True) 
>>> a 

[3, 2, 1] 


11.1.6 sorted() 


La fonction sorted () trie également une liste. Contrairement à la méthode précédente . sort(), cette fonction renvoie 
la liste triée et ne modifie pas la liste initiale : 


>>> a = [3, 1, 2] 
>>> sorted(a) 


[1, 2, 3] 
>>> a 
[3, 1, 2] 


La fonction sorted (O) supporte aussi l’ argument reverse=True : 


>>> a = [3, 1, 2] 
>>> sorted(a, reverse=True) 


[3, 2, 1] 
>>> a 
[3, 1, 2] 


11.1.7 .reverse() 


La méthode .reverse() inverse une liste : 


>>> a = [3, 1, 2] 
>>> a.reverse() 
>>> a 

[2, 1, 3] 
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11.18 .count() 


La méthode .count () compte le nombre d’éléments (passés en argument) dans une liste : 


>>> a = [1, 2, 4, 3, 1, 1] 
>>> a.count (1) 

3 

>>> a.count (4) 

T 

>>> a.count (23) 

0 


11.1.9 Particularités des méthodes associées aux listes 


— De nombreuses méthodes mentionnées précédemment (. append (), . sort (), etc.) modifient la liste mais ne renvoient 
rien, c’est-à-dire qu’elles ne renvoient pas d’objet récupérable dans une variable. Il s’agit d’un exemple d'utilisation 
de méthode (donc de fonction particulière) qui fait une action mais qui ne renvoie rien. Pensez-y dans vos utilisa- 
tions futures des listes : même si var = liste.reverse() est une instruction Python valide, elle n’a aucun intérêt, 
préférez-lui liste.reverse(). 


Remarque 
Pour exprimer la même idée, la documentation parle de modification de la liste « sur place » (in place en anglais) : 


>>> liste = [1, 2, 3] 
>>> help(liste.reverse) 
Help on built-in function reverse: 


reverse() method of builtins.list instance 
Reverse *IN PLACE*. 
Cela signifie que la liste est modifiée « sur place », c’est-à-dire dans la méthode au moment où elle s’exécute. La liste 
étant modifiée « en dur » dans la méthode, cette dernière ne renvoie donc rien. L’explication du mécanisme sous-jacent vous 
sera donnée dans la rubrique 12.4 Portée des listes du chapitre 12 Plus sur les fonctions. 


— Certaines méthodes ou instructions des listes décalent les indices d’une liste (par exemple . insert (), del, etc.). 
— Enfin, pour obtenir une liste exhaustive des méthodes disponibles pour les listes, utilisez la fonction dir(ma_liste) 
(ma_liste étant une liste). 


11.2 Construction d’une liste par itération 


La méthode .append() est très pratique car on peut l’utiliser pour construire une liste au fur et à mesure des itérations 
d’une boucle. 

Pour cela, il est commode de définir préalablement une liste vide de la forme ma_liste = []. Voici un exemple où une 
chaîne de caractères est convertie en liste : 


>>> seq = "CAAAGGTAACGC" 
>>> seq_list = [] 

>>> seq_list 

[] 


>>> for base in seq: 
seq_list.append(base) 


>>> seq_list 
is TASS MAS ay 'A', 'G', 'G', A PA, ME, O 'G', "C'] 


Remarquez que dans cet exemple, vous pouvez directement utiliser la fonction 1ist() qui prend n'importe quel objet 
séquentiel (liste, chaîne de caractères, etc.) et qui renvoie une liste : 


>>> seq = "CAAAGGTAACGC" 
>>> list (seq) 
Eres: PA 'A', MAS; 'G', 'G', Mrs MA VAS EX 'G! 1c'] 


Cette méthode est certes plus simple, mais il arrive parfois qu’on doive utiliser des boucles tout de même, comme lorsqu’on 
lit un fichier. On rappelle que l’instruction list (seq) convertit un objet de type chaîne de caractères en un objet de type liste 
(il s’agit donc d’une opération de casting). De même que list (range (10) ) convertit un objet de type range en un objet de 
type list. 
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FIGURE 11.1 — Copie de liste. 


11.3 Test d'appartenance 


L'opérateur in teste si un élément fait partie d’une liste. 


liste = [1, 3, 5, 7, 9] 
>>> 3 in liste 

True 

>>> 4 in liste 

False 

>>> 8 not in liste 
False 

>>> 4 not in liste 

True 


La variation avec not permet, a contrario, de vérifier qu’un élément n’est pas dans une liste. 


11.4 Copie de listes 


Il est très important de savoir que l’affectation d’une liste (à partir d’une liste préexistante) crée en réalité une référence 
et non une Copie : 


>>> Lis 2, 3] 


Vous voyez que la modification de x modifie y aussi ! Pour comprendre ce qui se passe nous allons de nouveau utiliser le 
site Python Tutor avec cet exemple (Figure 11.1) : 

Techniquement, Python utilise des pointeurs (comme dans le langage de programmation C) vers les mêmes objets. Python 
Tutor Villustre avec des flèches qui partent des variables x et y et qui pointent vers la même liste. Donc, si on modifie la liste 
x, la liste y est modifiée de la même manière. Rappelez-vous de ceci dans vos futurs programmes car cela pourrait avoir des 
effets désastreux ! 

Pour éviter ce problème, il va falloir créer une copie explicite de la liste initiale. Observez cet exemple : 


>>> x = [1, 2, 3] 
>>> y = x[:] 

>>> x[1] = -15 
>>> y 

[1, 2, 3] 


L'instruction x[:] a créé une copie « à la volée » de la liste x. Vous pouvez utiliser aussi la fonction List () qui renvoie 
explicitement une liste : 


>>> x = [1, 2, 3] 
>>> y = list(x) 
>>> x[1] = -15 
>>> y 

[1, 2, 3] 
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Python 3.6 


x El... 2; 31 
y = x[:] 
Z list(x) 
x[1] = -15 
-> print(y) 
print(z) 


Edit code | Live programming 
ited 


breakpoint; use the Back and Forward buttons to jump there. 


<Back | Step5of6 | Forward > Last >> 


Print output (drag lower right corner to resize) 
Frames Objects 
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FIGURE 11.2 — Copie de liste avec une tranche [:] et la fonction list (). 


Si on regarde à nouveau dans Python Tutor (Figure 11.2), on voit clairement que l’utilisation d’une tranche [:] ou de la 
fonction list () crée des copies explicites. Chaque flèche pointe vers une liste différente, indépendante des autres. 
Attention, les deux astuces précédentes ne fonctionnent que pour les listes à une dimension, autrement dit les listes qui ne 


contiennent pas elles-mêmes d’autres listes. Voyez par exemple : 


>>> x = [[1, 2], [3, 41] 
>>> x 

(C1, 2], (3, 4]] 

>>> y = x[:] 

>>> x[1] [1] = 55 

>>> x 

[[1, 2], (3, 55]] 

>>> y 

[[1, 2], (3, 55]] 


et 


>>> y = list (x) 

>>> x[1][1] = 77 
>>> x 

[[1, 2], (3, 77]] 
>>> y 

[[1, 2], (3, 77]] 


La méthode de copie qui fonctionne à tous les coups consiste à appeler la fonction deepcopy () du module copy. 


>>> import copy 

>>> x = [[1, 2], [3, 4]] 
>>> x 

[[1, 2], [3, 4]] 

>>> y = copy.deepcopy (x) 
>>> x[1][1] = 99 

>>> x 

[[1, 2], [3, 99]] 

>>> y 

[[1, 2], [3, 4]] 


11.5 Liste de compréhension 


Conseil : pour les débutants, vous pouvez passer cette rubrique. 


En Python, la notion de liste de compréhension (ou compréhension de listes) représente une manière originale et très 
puissante de générer des listes. La syntaxe de base consiste au moins en une boucle for au sein de crochets précédés d’une 


variable (qui peut être la variable d’itération ou pas ) : 
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>>> [i for i in range(10)] 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 91 
>>> [2 for i in range(10)] 
(2,5 2, 2, By 2, 2, 2, 2, 2, 2] 


Pour plus de détails, consultez à ce sujet le site de Python! et celui de Wikipédia ?. 
Voici quelques exemples illustrant la puissance des listes de compréhension. 


11.5.1 Nombres pairs compris entre 0 et 30 


>>> print([i for i in range(31) if i % == 0]) 
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30] 


11.5.2 Jeu sur la casse des mots d’une phrase 


>>> message "C'est sympa la Biolnfo" 

>>> msg_lst message.split () 

>>> print ([[m.upper(), len(m)] for m in msg_1st]) 
[["C'EST", 5], ['SYMPA', 5], ['LA', 2], ['BIOINFO', 71] 


11.5.3 Formatage d’une séquence avec 60 caractères par ligne 


Exemple d’une séquence constituée de 150 alanines : 


# Exemple d'une séquence de 150 alanines. 


>>> seq = "A" * 150 
>>> width = 60 
>>> seq_split = [seqli:i+width] for i in range(0, len(seq), width)] 


>>> print ("\n".join(seq_split)) 
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 


11.5.4 Formatage FASTA d’une séquence (avec la ligne de commentaire) 


Exemple d’une séquence constituée de 150 alanines : 


>>> com = "Séquence de 150 alanines" 

>>> seq = "A" * 150 

>>> width = 60 

>>> seq_split = [seqli:i+width] for i in range(0, len(seq), width)] 


>>> print (">"+comt+"\n"+"\n". join(seq_split)) 

>séquence de 150 alanines 
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 


11.5.5 Sélection des carbones alpha dans un fichier pdb 


Exemple avec la structure de la barstar * : 
>>> with open("ibta.pdb", "r") as f_pdb: 


CA_lines = [line for line in f_pdb if line.startswith ("ATOM") 


and line [12:16].strip() == "CA"] 


>>> print (len(CA_lines)) 
89 


11.6 Exercices 


Conseil : pour ces exercices, créez des scripts puis exécutez-les dans un shell. 


1. http: //www.python.org/dev/peps/pep-0202/ 
2. http://fr.wikipedia.org/wiki/Comprehension_de_liste 
3. http: //www.rcsb.org/pdb/explore.do?structureId=1BTA 
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11.6.1 Tri de liste 


Soit la liste de nombres [8, 3, 12.5, 45, 25.5, 52, 1]. Triez les nombres de cette liste par ordre croissant, sans 
utiliser la fonction sort (). Les fonctions et méthodes min(), .append() et .remove() vous seront utiles. 


11.6.2 Séquence d’ADN aléatoire 


Créez une fonction seq_alea() qui prend comme argument un entier positif taille représentant le nombre de bases de 
la séquence et qui renvoie une séquence d’ADN aléatoire sous forme d’une liste de bases. Utilisez la méthode . append () 
pour ajouter les différentes bases à la liste et la fonction random. choice() du module random pour choisir une base parmi 
les 4 possibles. 

Utilisez cette fonction pour générer aléatoirement une séquence d’ ADN de 15 bases. 


11.6.3 Séquence d’ADN complémentaire inverse 


Créez une fonction comp_inv() qui prend comme argument une séquence d'ADN sous la forme d’une chaîne de ca- 
ractères, qui renvoie la séquence complémentaire inverse sous la forme d’une autre chaîne de caractères et qui utilise des 
méthodes associées aux listes. 

Utilisez cette fonction pour transformer la séquence d’ADN TCTGTTAACCATCCACTTCG en sa séquence complémentaire 
inverse. 

Rappel : la séquence complémentaire inverse doit être « inversée ». Par exemple, la séquence complémentaire inverse de 
la séquence ATCG est CGAT. 


11.6.4 Doublons 


Soit la liste de nombres liste = [5, 1, 1, 2, 5, 6, 3, 4, 4, 4, 2]. 
À partir de liste, créez une nouvelle liste sans les doublons, triez-la et affichez-la. 


11.6.5 Séquence d’ADN aléatoire 2 


Créez une fonction seq_alea_2() qui prend comme argument un entier et quatre floats représentant respectivement la 
longueur de la séquence et les pourcentages de chacune des 4 bases A, T, G et C. La fonction générera aléatoirement une 
séquence d' ADN qui prend en compte les contraintes fournies en arguments et renverra la séquence sous forme d’une liste. 

Utilisez cette fonction pour générer aléatoirement une séquence d’ADN de 50 bases contenant 10 % de A, 30 % de T, 50 
% de G et 10 % de C. 

Conseil : la fonction random. shuffle () du module random vous sera utile. 


11.6.6 Le nombre mystère 


Trouvez le nombre mystére qui répond aux conditions suivantes : 

— Il est composé de 3 chiffres. 

— Il est strictement inférieur à 300. 

— Il est pair. 

— Deux de ses chiffres sont identiques. 

— La somme de ses chiffres est égale à 7. 

On vous propose d’employer une méthode dite « brute force », c’est-à-dire d’utiliser une boucle et à chaque itération de 
tester les différentes conditions. 


11.6.7 Triangle de Pascal (exercice +++) 


Voici le début du triangle de Pascal : 


1 

1: «1 

42 <1 
1331 
14641 
1 5 10 10 5 1 
eee 
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Déduisez comment une ligne est construite à partir de la précédente. Par exemple, à partir de la ligne 2 (1 1), construisez 
la ligne suivante (ligne 3 : 1 2 1) et ainsi de suite. 

Implémentez cette construction en Python. Généralisez à l’aide d’une boucle. 

Écrivez dans un fichier pascal . out les 10 premières lignes du triangle de Pascal. 
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Chapitre 12 


Plus sur les fonctions 


Avant d’aborder ce chapitre, nous vous conseillons de relire le chapitre 9 Fonctions et de bien en assimiler toutes les notions 
(et aussi d’en faire les exercices). Nous avons vu dans ce chapitre 9 le concept puissant et incontournable que représentent les 
fonctions. Nous avons également introduit la notion de variables locales et globales. 

Dans ce chapitre, nous allons aller un peu plus loin sur la visibilité de ces variables dans et hors des fonctions, et aussi voir 
ce qui se passe lorsque ces variables sont des listes. Attention, la plupart des lignes de code ci-dessous sont données à titre 
d'exemple pour bien comprendre ce qui se passe, mais nombre d’entre elles sont des aberrations en terme de programmation. 
Nous ferons un récapitulatif des bonnes pratiques à la fin du chapitre. Enfin, nous vous conseillons de tester tous les exemples 
ci-dessous avec le site Python Tutor ! afin de suivre l’état des variables lors de l’exécution des exemples. 


12.1 Appel d’une fonction dans une fonction 


Dans le chapitre 9 nous avons vu des fonctions qui étaient appelées depuis le programme principal. Il est en fait possible 
d'appeler une fonction depuis une autre fonction. Et plus généralement, on peut appeler une fonction de n’importe où à partir 
du moment où elle est visible par Python (c’est-à-dire chargée dans la mémoire). Observez cet exemple : 

# définition des fonctions 


def polynome(x): 
return (x**2 - 2*x + 1) 


def calc_vals(debut, fin): 
liste _vals = [] 
for x in range(debut, fin + 1): 
liste_vals.append(polynome(x)) 
return liste_vals 


# programme principal 
print(calc_vals(-5, 5)) 


Nous appelons depuis le programme principal la fonction calc_vals(), puis à l’intérieur de celle-ci nous appelons 
l’autre fonction polynome(). Regardons ce que Python Tutor nous montre lorsque la fonction polynome () est exécutée dans 
la Figure 12.1. 

L'espace mémoire alloué à polynome() est grisé, indiquant que cette fonction est en cours d’exécution. La fonction 
appelante calc_vals() est toujours là (sur un fond blanc) car son exécution n’est pas terminée. Elle est en quelque sorte 
figée dans le même état qu’avant l’appel de polynome(), et on pourra ainsi noter que ses variables locales (debut, fin, 
liste_vals et x) sont toujours là . De manière générale, les variables locales d’une fonction ne seront détruites que lorsque 
l'exécution de celle-ci sera terminée. Dans notre exemple, les variables locales de calc_vals() ne seront détruites que 
lorsque la boucle sera terminée et que la liste liste_vals sera retournée au programme principal. Enfin, notez bien que la 
fonction calc_vals() appelle la fonction polynome () à chaque itération de la boucle. 

Ainsi, le programmeur est libre de faire tous les appels qu’il souhaite. Une fonction peut appeler une autre fonction, cette 
dernière peut appeler une autre fonction et ainsi de suite (et autant de fois qu’on le veut). Une fonction peut même s’appeler 
elle-même, cela s’appelle une fonction récursive (voir la rubrique suivante). Attention toutefois à retrouver vos petits si vous 
vous perdez dans les appels successifs ! 


1. http://www.pythontutor.com/ 
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Python 3.6 Print output (drag lower right corner to resize) 


def polynome (x) : 


— 4 xotusn (x**2 = 24x + 1) . 
Frames Objects 
def calc_vals (debut, fin): Gid al Frame function 
liste vals = [] polynome (x) 
for x in range(debut,fin + 1): polynome 
liste_vals.append (polynome (x) ) calc_vals function 
ta: ee calc vals(debut, fin) 
calc vals list 
# programme principal ieee |5 0 
print(calc vals(-5,5)) 36 
= fin 5 
Edit this code liste_vals 
at has just executed x |-4 
1e to execute 
of code to set a breakpoint; use the Back and Forward buttons to jump there. polynome 
x |-4 
<< First <Back | Step 15 of 63 Last >> | Return [75 
value 


FIGURE 12.1 — Appel d'une fonction dans une fonction. 


12.2 Fonctions récursives 


Conseil : pour les débutants, vous pouvez passer cette rubrique. 

Une fonction récursive est une fonction qui s’appelle elle-même. Les fonctions récursives permettent d’obtenir une effica- 
cité redoutable dans la résolution de certains algorithmes comme le tri rapide? (en anglais quicksort). 

Oublions la recherche d’efficacité pour l’instant et concentrons-nous sur l’exemple de la fonction mathématique factorielle. 
Nous vous rappelons que la factorielle s’écrit avec un ! et se définit de la manière suivante : 


31=3x2x1=6 
41=4x3x2x1=30 


nl=nxn—=1x...x2x1 


Voici le code Python avec une fonction récursive : 


def calc_factorielle(nb): 
if nb == 1: 
return 1 
else: 


return nb * calc_factorielle(nb - 1) 


# prog principal 
print(calc_factorielle(4)) 

Pas très facile à comprendre, n’est-ce pas ? À nouveau, nous nous aidons de Python Tutor pour visualiser ce qui se passe 
dans la figure 12.2 (nous vous conseillons bien súr de tester vous-méme cet exemple) : 

Ligne 8, on appelle la fonction calc_factorielle() en passant comme argument l’entier 4. Dans la fonction, la variable 
locale qui récupère cet argument est nb. Au sein de la fonction, celle-ci se rappelle elle-même (ligne 5), mais cette fois-ci en 
passant la valeur 3. Au prochain appel, ce sera avec la valeur 2, puis finalement 1. Dans ce dernier cas, le test if nb == 1: 
est vrai et l’instruction return 1 sera exécutée. À ce moment précis de l’exécution, les appels successifs forment une sorte 
de pile (voir la figure 12.2). La valeur 1 sera ainsi renvoyée au niveau de l’appel précédent, puis le résultat 2 x 1 = 2 (où 2 
correspond à nb et 1 provient de calc_factorielle(nb - 1) soit 1) va être renvoyé à l’appel précédent, puis 3 x 2 = 6 
(où 3 correspond à nb et 2 provient de calc_factorielle(nb - 1) soit 2) va être renvoyé à l’appel précédent, pour finir 
par 4 x 6 = 24 (où 4 correspond à nb et 6 provient de calc_factorielle(nb - 1) soit 6), soit la valeur de !4. Les appels 
successifs vont donc se « dépiler » et nous reviendrons dans le programme principal. 


2. https://fr.wikipedia.org/wiki/Tri_ rapide 


Cours de Python / Université de Paris / UFR Sciences du Vivant 


97 


Chapitre 12. Plus sur les fonctions 12.3. Portée des variables 


Print output (drag lower right corner to resize) 
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3 return À Frames Objects 
else: Global frame function 
return nb * calc_ factorielle (nb - 1) calc factorielle (nb) 


calc_factorielle 


# prog principal 

print (calc _factorielle (4) ) calc_factorielle 
n | nb |4 
Edit this code 


that has just executed 
calc_ factorielle 


t line to execute 
nb |3 


ine of code to set a breakpoint; use the Back and Forward buttons to jump there. 


calc_ factorielle 


<< First Step 15 of 18 | Forward> | [ Last >> 


d by @pabovine. Support with a small donation. 
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calc factorielle 
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n 
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1 just cleared up a misunderstanding! 


1 


FIGURE 12.2 — Fonction récursive : factorielle. 


Même si les fonctions récursives peuvent être ardues à comprendre, notre propos est ici de vous illustrer qu’une fonction 
qui en appelle une autre (ici il s’agit d’elle-même) reste « figée » dans le même état, jusqu’à ce que la fonction appelée lui 
renvoie une valeur. 


12.3 Portée des variables 


Il est très important lorsque l’on manipule des fonctions de connaître la portée des variables (scope en anglais), c’est-à-dire 
savoir 14 où elles sont visibles. On a vu que les variables créées au sein d’une fonction ne sont pas visibles à l’extérieur de 
celle-ci car elles étaient locales à la fonction. Observez le code suivant : 


>>> def ma_fonction(): 
i x = 
print(f"x vaut {x} dans la fonction") 


>>> ma_fonction() 

x vaut 2 dans la fonction 

>>> print (x) 

Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 

NameError: name 'x' is not defined 


Lorsque Python exécute le code de la fonction, il connait le contenu de la variable x. Par contre, de retour dans le module 
principal (dans ce cas, il s’agit de l’interpréteur Python), il ne la connaît plus, d’où le message d’ erreur. 
De méme, une variable passée en argument est considérée comme locale lorsqu’on arrive dans la fonction : 


>>> def ma_fonction(x): 
print(f"x vaut {x} dans la fonction") 


>>> ma_fonction (2) 

x vaut 2 dans la fonction 

>>> print (x) 

Traceback (most recent call last): 
File "<stdin>", line 1, in ? 

NameError: name 'x' is not defined 


Lorsqu’une variable est déclarée dans le programme principal, elle est visible dans celui-ci ainsi que dans toutes les 
fonctions. On a vu qu’on parlait de variable globale : 
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>>> def ma_fonction(): 
print(x) 

>>> x = 3 

>>> ma_fonction() 


>>> print (x) 


Dans ce cas, la variable x est visible dans le module principal et dans toutes les fonctions du module. Toutefois, Python ne 
permet pas la modification d’une variable globale dans une fonction : 


>>> def ma_fonction(): 
X = x + 1 


>>> x = 1 
>>> ma_fonction() 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
File "<stdin>", line 2, in fct 
UnboundLocalError: local variable 'x' referenced before assignment 
L'erreur renvoyée montre que Python pense que x est une variable locale qui n’a pas été encore assignée. Si on veut 


vraiment modifier une variable globale dans une fonction, il faut utiliser le mot-clé global : 


>>> def ma_fonction(): 


global x 
x = x + 1 
>>> x = 1 
>>> ma_fonction() 
>>> x 
2 


Dans ce dernier cas, le mot-clé global a forcé la variable x à être globale plutôt que locale au sein de la fonction. 


12.4 Portée des listes 


Attention 
Les exemples de cette partie représentent des absurdités en termes de programmation. Ils sont donnés à titre indicatif pour 
comprendre ce qui se passe, mais il ne faut surtout pas s’en inspirer ! 


Soyez extrêmement attentifs avec les types modifiables (tels que les listes) car vous pouvez les changer au sein d’une 
fonction : 
>>> def ma_fonction(): 
liste[1] = -127 


>>> liste = [1,2,3] 
>>> ma_fonction() 
>>> liste 

[1, -127, 3] 


De méme, si vous passez une liste en argument, elle est modifiable au sein de la fonction : 


>>> def ma_fonction(x): 
x[1] = -15 

>> y = [1,2,3] 

>>> ma_fonction(y) 

>>> y 


[1, -15, 3] 

Pour bien comprendre l’origine de ce comportement, utilisons à nouveau le site Python Tutor >. La figure 12.3 vous montre 
le mécanisme à l’oeuvre lorsqu’ on passe une liste à une fonction. 

L'instruction pass dans la fonction est une instruction Python qui ne fait rien. Elle est lá car une fonction ne peut être vide 
et doit contenir au moins une instruction Python valide. 

On voit très clairement que la variable liste passée en argument lors de l’appel de la fonction d’une part, et la variable 
locale liste_tmp au sein de la fonction d’autre part, pointent vers le même objet dans la mémoire. Ainsi, si on modifie 


3. http://wwuw.pythontutor.com/ 
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Python 3.6 
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-=> def ma_fonction(liste tmp): Global frame function 
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ma_ fonction 
à liste list 
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ma_fonction (liste) = 


liste_tmp 
Edit this code 
line that just executed 
=> next line to execute 


| << First | | < Prev | | Next > | | Last >> 


Step 4 of 6 


FIGURE 12.3 — Passage d’une liste à une fonction. 


liste_tmp, on modifie aussi liste. C’est exactement le méme mécanisme que pour la copie de listes (cf. rubrique 11.4 
Copie de listes du chapitre 11 Plus sur les listes). 
Si vous voulez éviter les problèmes de modification malencontreuse d’une liste dans une fonction, utilisez des tuples (ils 
seront présentés dans le chapitre 13 Dictionnaires et tuples), Python renverra une erreur car ces derniers sont non modifiables. 
Une autre solution pour éviter la modification d’une liste, lorsqu’ elle est passée comme argument à une fonction, est de la 
passer explicitement (comme nous |’ avons fait pour la copie de liste) afin qu’ elle reste intacte dans le programme principal. 
>>> def ma_fonction(x): 
x[1] = -15 
>>> y = [1, 2, 3] 
>>> ma_fonction(y[:]) 


>>> y 

[1, 2, 3] 

>>> ma_fonction(list(y)) 
>>> y 

Us 2, 31 


Dans ces deux derniers exemples, une copie de y est créée à la volée lorsqu’on appelle la fonction, ainsi la liste y du 
module principal reste intacte. 


D’autres suggestions sur l’envoi de liste dans une fonction vous sont données dans la rubrique Recommandations ci- 
dessous. 


12.5 Règle LGI 


Lorsque Python rencontre une variable, il va traiter la résolution de son nom avec des priorités particulières. D’abord il 
va regarder si la variable est locale, puis si elle n’existe pas localement, il vérifiera si elle est globale et enfin si elle n’est pas 
globale, il testera si elle est interne (par exemple la fonction len() est considérée comme une fonction interne à Python, elle 
existe à chaque fois que vous lancez Python). On appelle cette règle la règle LGI pour locale, globale, interne. En voici un 
exemple : 

>>> def ma_fonction(): 
... r 
print(f"Dans la fonction x vaut {x}") 
>>> x = -15 
>>> ma_fonction() 
Dans la fonction x vaut 4 


>>> print(f"Dans le module principal x vaut {x}") 
Dans le module principal x vaut -15 


Dans la fonction, x a pris la valeur qui lui était définie localement en priorité sur la valeur définie dans le module principal. 


Conseil 
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Même si Python peut reconnaître une variable ayant le même nom que ses propres fonctions ou variables internes, évitez 
de les utiliser car ceci rendra votre code confus ! 


De manière générale la règle LGI découle de la manière dont Python gère ce que l’on appelle « les espaces de noms ». 
C’est cette gestion qui définit la portée (visibilité) de chaque variable. Nous en parlerons plus longuement dans le chapitre 19 
Avoir la classe avec les objets. 


12.6 Recommandations 


12.6.1 Évitez les variables globales 


Dans ce chapitre nous avons joué avec les fonctions (et les listes) afin de vous montrer comment Python réagissait. Toute- 
fois, notez bien que l’utilisation de variables globales est à bannir définitivement de votre pratique de la programmation. 

Parfois on veut faire vite et on crée une variable globale visible partout dans le programme (donc dans toutes les fonctions), 
car « Ca va plus vite, c'est plus simple ». C’est un très mauvais calcul, ne serait-ce que parce que vos fonctions ne seront pas 
réutilisables dans un autre contexte si elles utilisent des variables globales ! Ensuite, arriverez-vous à vous relire dans six 
mois ? Quelqu'un d’autre pourrait-il comprendre votre programme ? Il existe de nombreuses autres raisons * que nous ne 
développerons pas ici, mais libre à vous de consulter de la documentation externe. 

Heureusement, Python est orienté objet et permet « d’encapsuler » des variables dans des objets et de s’affranchir défini- 
tivement des variables globales (nous verrons cela dans le chapitre 19 Avoir la classe avec les objets). En attendant, et si vous 
ne souhaitez pas aller plus loin sur les notions d’objet (on peut tout à fait « pythonner » sans cela), retenez la chose suivante 
sur les fonctions et les variables globales : 


Conseil 
Plutôt que d’utiliser des variables globales, passez vos variables explicitement aux fonctions comme des argument(s). 


12.6.2 Modification d’une liste dans une fonction 


Concernant les fonctions qui modifient une liste, nous vous conseillons de l’indiquer clairement dans votre code. Pour 
cela, faites en sorte que la fonction renvoie la liste modifiée et de récupérer cette liste renvoyée dans une variable portant le 
même nom. Par exemple : 

def ajoute _un(liste): 
for indice in range(len(liste)): 


listelindice] += 1 
return liste 


# Programme principal. 

liste_notes = [10, 8, 16, 7, 15] 
liste_notes = ajoute_un(liste_notes) 
print (liste_notes) 


La ligne 8 indique que la liste Liste_notes passée à la fonction est écrasée par la liste renvoyée par la fonction. 
Le code suivant produirait la méme sortie : 
def ajoute_un(liste): 


for indice in range(len(liste)): 
liste[indice] += 1 


# Programme principal. 
liste_notes = [10, 8, 16, 7, 15] 
ajoute_un(liste_notes) 

print (liste_notes) 


Cela reste toutefois moins intuitif car il n’est pas évident de comprendre que la liste est modifiée dans la fonction en lisant 
la ligne 7. Dans un tel cas, il serait essentiel d’indiquer dans la documentation de la fonction que la liste est modifiée « sur 
place » (in place en anglais) dans la fonction. Vous verrez dans le chapitre 14 Création de modules comment documenter vos 
fonctions. 


4. http://wiki.c2.com/?GlobalVariablesAreBad 
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Conseil 


Pour les raisons évoquées ci-dessus, nous vous conseillons de privilégier la première version : 


liste _notes = ajoute _un(liste_notes) 


12.6.3 Conclusion 


Vous connaissez maintenant les fonctions sous tous leurs angles. Comme indiqué en introduction du chapitre 9, elles sont 

incontournables et tout programmeur se doit de les maitriser. Voici les derniers conseils que nous pouvons vous donner : 

— Lorsque vous débutez un nouveau projet de programmation, posez-vous la question : « Comment pourrais-je décom- 
poser en blocs chaque tâche à effectuer, chaque bloc pouvant être une fonction ? ». Et n’oubliez pas que si une fonction 
s’avère trop complexe, vous pouvez la décomposer en d’autres fonctions. 

— Au risque de nous répéter, forcez-vous a utiliser des fonctions en permanence. Pratiquez, pratiquez... et pratiquez 


encore ! 


12.7 Exercices 


Conseil : pour le second exercice, créez un script puis exécutez-le dans un shell. 


12.7.1 Prédire la sortie 


Prédisez le comportement des codes suivants, sans les recopier dans un script ni dans l’interpréteur Python : 


Code 1 


def hello(prenom): 
print(f"Bonjour {prenom}") 


# Programme principal. 
hello("Patrick") 
print (x) 


Code 2 


def hello(prenom): 
print (f"Bonjour {prenom}") 


# Programme principal. 
x = 10 
hello("Patrick") 

print (x) 


Code 3 


def hello(prenom): 
print (f"Bonjour {prenom}") 
print (x) 


# Programme principal. 
x = 

hello("Patrick") 

print (x) 


Code 4 


def hello(prenom): 
x = 42 
print (f"Bonjour {prenom}") 
print (x) 


# Programme principal. 
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x = 10 
hello("Patrick") 
print (x) 


12.7.2 Passage de liste à une fonction 


Créez une fonction ajoute_nb_alea() qui prend en argument une liste et qui ajoute un nombre entier aléatoire entre -10 
et 10 (inclus) à chaque élément. La fonction affichera à l’écran cette nouvelle liste modifiée. 
Dans le programme principal, on effectuera les actions suivantes : 


1. Créez une variable ma_liste = [7, 3, 8, 4, 5, 1, 9, 10, 2, 6]. 
2. Affichez ma_liste à l’écran. 
3. Appelez la fonction ajoute_nb_alea() en lui passant ma_liste en argument. 


4. Affichez à nouveau ma_liste à l’écran. 


Comment expliquez-vous le résultat obtenu ? 


Cours de Python / Université de Paris / UFR Sciences du Vivant 103 


Chapitre 13 


Dictionnaires, tuples et sets 


Jusqu’à maintenant nous avons vu et manipulé le type d’objet séquentiel le plus classique : les listes. On se rappelle 
qu’elles sont modifiables, ordonnées et itérables. Dans ce chapitre nous allons voir trois nouveaux types d’ objet séquentiel 
avec des propriétés différentes : les dictionnaires, les tuples et les sets. 


Remarque 
Les objets séquentiels peuvent étre aussi appelés parfois containers. 


13.1 Dictionnaires 


13.1.1 Définition 


Les dictionnaires se révèlent très pratiques lorsque vous devez manipuler des structures complexes à décrire et que les 
listes présentent leurs limites. Les dictionnaires sont des collections non ordonnées d’ objets, c’est-à-dire qu’il n’y a pas de 
notion d’ ordre (i.e. pas d'indice). On accède aux valeurs d’un dictionnaire par des clés. Ceci semble un peu confus ? Regardez 
l'exemple suivant : 


>>> anil = {} 

>>> aniil"nom"] = "girafe" 

>>> aniil'"taille"] = 5.0 

>>> anil["poids"] = 1100 

>>> anil 

{'nom': 'girafe', 'taille': 5.0, 'poids': 1100} 


En premier, on définit un dictionnaire vide avec les accolades {} (tout comme on peut le faire pour les listes avec []). 
Ensuite, on remplit le dictionnaire avec différentes clés ("nom", "taille", "poids") auxquelles on affecte des valeurs 
("girafe", 5.0, 1100). Vous pouvez mettre autant de clés que vous voulez dans un dictionnaire (tout comme vous pouvez 
ajouter autant d’ éléments que vous voulez dans une liste). 


Remarque 
Un dictionnaire est affiché sans ordre particulier. 


On peut aussi initialiser toutes les clés et les valeurs d’un dictionnaire en une seule opération : 
>>> ani2 = {"nom": "singe", "poids": 70, "taille": 1.75} 
Mais rien ne nous empêche d’ ajouter une clé et une valeur supplémentaire : 
>>> ani2["age"] = 15 
Pour récupérer la valeur associée 4 une clé donnée, il suffit d’utiliser la syntaxe suivante dictionnaire["cle"]. Par 
exemple : 


>>> anil["taille"] 
5.0 
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Remarque 
Toutes les clés de dictionnaire utilisées jusqu’à présent étaient des chaînes de caractères. Rien n’empêche d’utiliser d’autres 
types d’ objets comme des entiers (voire même des tuples, cf. rubrique suivante), cela peut parfois s’avérer très utile. 
Néanmoins, nous vous conseillons, autant que possible, d’utiliser systématiquement des chaînes de caractères pour vos 
clés de dictionnaire. 


Après ce premier tour d’horizon, on voit tout de suite l’avantage des dictionnaires. Pouvoir retrouver des éléments par des 
noms (clés) plutôt que par des indices. Les humains retiennent mieux les noms que les chiffres. Ainsi, l’usage des dictionnaires 
rend en général le code plus lisible. Par exemple, si nous souhaitions stocker les coordonnées (x,y,z) d’un point dans l’espace : 
coors = [0, 1, 2] pour la version liste, coors = {"x": 0, "y": 1, "z": 2} pour la version dictionnaire. Un lecteur 
comprendra tout de suite que coors["z"] contient la coordonnée z, ce sera moins intuitif avec coors [2]. 


13.1.2 Itération sur les clés pour obtenir les valeurs 


Il est possible d’obtenir toutes les valeurs d’un dictionnaire à partir de ses clés : 


>>> ani2 = {'nom': 'singe', 'poids': 70, 'taille': 1.75} 
>>> for key in ani2: 
print(key, ani2[key]) 
poids 70 
nom singe 
taille 1.75 


13.1.3 Méthodes .keys(), .values() et .items() 


Les méthodes .keys() et .values() renvoient, comme vous pouvez vous en doutez, les clés et les valeurs d'un diction- 
naire : 


>>> ani2.keys() 

dict_keys(['poids', 'nom', 'taille']) 
>>> ani2.values() 

dict_values([70, 'singe', 1.75]) 


Les mentions dict_keys et dict_values indiquent que nous avons à faire à des objets un peu particuliers. Ils ne sont 
pas indexables (on ne peut pas retrouver un élément par indice, par exemple dico . keys () [0] renverra une erreur). Si besoin, 
nous pouvons les transformer en liste avec la fonction list () : 


>>> ani2.values() 
dict_values(['singe', 70, 1.75]) 
>>> list (ani2.values ()) 
['singe', 70, 1.75] 


Toutefois, ce sont des objets « itérables », donc utilisables dans une boucle. 
Conseil : pour les débutants, vous pouvez sauter cette fin de rubrique. 
Enfin, il existe la méthode . items () qui renvoie un nouvel objet dict_items : 


>>> dico = {0: "t", 1: "o", 2: "t", 3: "o") 
>>> dico.items () 
dict_items([(0, 't'), (1, 'o'), (2, 't'), (3, '0')]) 


Celui-ci n’est pas indexable (on ne peut pas retrouver un élément par un indice) mais il est itérable : 


>>> dico.items () [2] 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: 'dict_items' object is not subscriptable 
>>> for key, val in dico.items(): 
print(key, val) 


WNRO:» + 
od tod 


Notez la syntaxe particulière qui ressemble à la fonction enumerate () vue au chapitre 5 Boucles et comparaisons. On 
itère à la fois sur key et sur val. On verra plus bas que cela peut-être utile pour construire des dictionnaires de compréhension. 
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13.1.4 Existence d’une clé 


Pour vérifier si une clé existe dans un dictionnaire, on peut utiliser le test d’appartenance avec l’instruction in qui renvoie 


un booléen : 
>>> ani2 = {'nom': 'singe', 'poids': 70, 'taille': 1.75} 
>>> if "poids" in ani2: 
print ("La clé 'poids' existe pour ani2") 


La clé 'poids' existe pour ani2 
>>> if "age" in ani2: 
print ("La clé 'age' existe pour ani2") 


Dans le second test (lignes 5 à 7), le message n’est pas affiché car la clé age n’est pas présente dans le dictionnaire ani2. 


13.15 Méthode .get() 


La méthode .get () extrait la valeur associée à une clé mais ne renvoie pas d’erreur si la clé n’existe pas : 

>>> ani2 = {'nom': 'singe', 'poids': 70, 'taille': 1.75} 

>>> ani2.get ("nom") 

‘singe 

>>> ani2.get ("age") 

>>> 

Ici la valeur associée à la clé nom est singe mais la clé age n’existe pas. On peut également indiquer à . get () une valeur 
par défaut si la clé n’existe pas : 


>>> ani2.get("age", 42) 
42 


13.1.6 Tri par clés 


On peut utiliser la fonction sorted() vue précédemment avec les listes pour trier un dictionnaire par ses clés : 


>>> ani2 = {'nom': 'singe', 'taille': 1.75, 'poids': 70} 
>>> sorted(ani2) 
['nom', 'poids', 'taille'] 


Les clés sont triées ici par ordre alphabétique. 


13.1.7 Tri par valeurs 


Pour trier un dictionnaire par ses valeurs, il faut utiliser la fonction sorted avec l’argument key : 
>>> dico = {"a": 15, "b": 5, “Set 20} 
>>> sorted(dico, key=dico.get) 
E t b 1 5 1 a ! ; ! c 1 ] 
L'argument key=dico.get indique explicitement qu'il faut réaliser le tri par les valeurs du dictionnaire. On retrouve la 
méthode .get () vue plus haut, mais sans les parenthèses (key=dico.get mais pas key=dico.get()). 
Attention, ce sont les clés du dictionnaires qui sont renvoyées, pas les valeurs. Ces clés sont cependant renvoyées dans un 
ordre qui permet d’obtenir les clés triées par ordre croissant : 
>>> dico = {"a": 15, "b": 5, “ets 20} 
>>> for key in sorted(dico, key=dico.get): 
print (key, dico[key]) 


Enfin, l argument reverse=True fonctionne également : 


>>> dico = {"a": 15, "b": 5, "c":20} 
>>> sorted(dico, key=dico.get, reverse=True) 
['c! la! rt] 


Remarque 
Lorsqu’on trie un dictionnaire par ses valeurs, il faut être sûr que cela soit possible. Ce n’est, par exemple, pas le cas pour 
le dictionnaire ani2 car les valeurs sont des valeurs numériques et une chaîne de caractères : 
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>>> ani2 = {'nom': 'singe', 'poids': 70, 'taille': 1.75} 
>>> sorted(ani2, key=ani2. get) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: '<' not supported between instances of 'int' and 'str' 


On obtient ici une erreur car Python ne sait pas comparer une chaine de caractéres (singe) avec des valeurs numériques 
(70 et 1.75). 


13.1.8 Clé associée au minimum ou au maximum des valeurs 


Les fonctions min() et max(), que vous avez déjà manipulées dans les chapitres précédents, acceptent également l’argu- 
ment key=. On peut ainsi obtenir la clé associée au minimum ou au maximum des valeurs d’un dictionnaire : 
>>> dico = {"a": 15, "b": 5, "c":20} 
>>> max(dico, key=dico.get) 
$ c ! 
>>> min(dico, key=dico.get) 
1 b ! 


13.19 Liste de dictionnaires 


En créant une liste de dictionnaires qui possèdent les mêmes clés, on obtient une structure qui ressemble à une base de 
données : 


>>> animaux = [anii, ani2] 

>>> animaux 

[{'nom': 'girafe', 'poids': 1100, 'taille': 5.0}, {'nom': 'singe', 
‘poids ': 70, 'taille': 1.75}] 

>>> 


>>> for ani in animaux: 
print (ani["nom"]) 
girafe 
singe 
Vous constatez ainsi que les dictionnaires permettent de gérer des structures complexes de manière plus explicite que les 
listes. 


13.1.10 Fonction dict ( 


Conseil : Pour les débutants vous pouvez sauter cette rubrique. 

La fonction dict () va convertir l’argument qui lui est passé en dictionnaire. Il s’agit donc d’une fonction de casting 
comme int(), str(), etc. Toutefois, l’argument qui lui est passé doit avoir une forme particulière : un objet séquentiel 
contenant d’autres objets séquentiels de 2 éléments. Par exemple, une liste de listes de 2 éléments : 

>>> liste_animaux = [["girafe", 2], ["singe", 3]] 


>>> dict (liste_animaux) 
{'girafe': 2, 'singe': 3} 


Ou un tuple de tuples de 2 éléments (cf. rubrique suivante pour la définition d’un tuple), ou encore une combinaison liste 
/ tuple : 


>>> tuple_animaux = (("girafe", 2), ("singe", 3)) 
>>> dict (tuple_animaux) 

{'girafe': 2, 'singe': 3} 

>>> 

>>> dict([("girafe", 2), ("singe", 3)]) 
{'girafe': 2, 'singe': 3} 


Si un des sous-éléments a plus de 2 éléments (ou moins), Python renvoie une erreur : 
>>> dict([("girafe", 2), ("singe", 3, 4)]) 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module> 
ValueError: dictionary update sequence element #1 has length 3; 2 is required 
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13.2 Tuples 
13.2.1 Définition 


Les tuples (« n-uplets » en français) correspondent aux listes à la différence qu’ils sont non modifiables. On a vu dans le 
chapitre 11 Plus sur les listes que les listes pouvaient être modifiées par références, notamment lors de la copie de listes. Les 
tuples s’affranchissent de ce problème puisqu'ils sont non modifiables. Pratiquement, ils utilisent les parenthèses au lieu des 


crochets : 
>>> x = (1, 2, 3) 
>>> x 
(1, 2, 3) 
>>> x[2] 
3 
>>> x[0:2] 
(1, 2) 
>>> x[2] = 15 
Traceback (innermost last): 
File "<stdin>", line 1, in ? 
TypeError: object doesn't support item assignment 


Laffectation et l’indiçage fonctionnent comme avec les listes. Mais si on essaie de modifier un des éléments du tuple, 
Python renvoie un message d’ erreur. Si vous voulez ajouter un élément (ou le modifier), vous devez créer un autre tuple : 
>>> x = (1, 2, 3) 


>>> x + (2,) 
(1, 2, 3, 2) 


Remarque 
Pour utiliser un tuple d'un seul élément, utilisez une syntaxe avec une virgule (element, ), pour éviter une ambiguïté 
avec une simple expression. 
Autre particularité des tuples, il est possible d’en créer de nouveaux sans les parenthèses, dès lors que ceci ne pose pas 
d’ambiguité avec une autre expression : 


>>> x = (1, 2, 3) 


>>> x 

(1, 2, 3) 

>>> x = 1, 2, 3 
>>> x 

(1, 2, 3) 


Toutefois, nous vous conseillons d’ utiliser systématiquement les parenthèses afin d’ éviter les confusions. 


Enfin, on peut utiliser la fonction tuple (sequence) qui fonctionne exactement comme la fonction list (), c’est-à-dire 
qu’elle prend en argument un objet séquentiel et renvoie le tuple correspondant (opération de casting) : 


>>> tuple([1,2,3]) 


(1, 2, 3) 

>>> tuple("ATGCCGCGAT") 

CA', MTS 'G', MCE, CS 'G', Cr 'G', HAE à TA) 
Remarque 


Les listes, les dictionnaires et les tuples sont des objets qui peuvent contenir des collections d’autres objets. On peut donc 
construire des listes qui contiennent des dictionnaires, des tuples ou d’autres listes, mais aussi des dictionnaires contenant des 
tuples, des listes, etc. 


13.2.2 Itérations sur plusieurs valeurs à la fois 


Pratiquement, nous avons déjà croisé les tuples avec la fonction enumerate () dans le chapitre 5 Boucles et comparaisons. 
Cette dernière permettait d’itérer en même temps sur les indices et les éléments d’une liste : 


>>> for indice, element in enumerate([75, -75, 0]): 
print(indice, element) 
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0 75 

1 -75 

2 0 

>>> for bidule in enumerate([75, -75, 0]): 
print (bidule, type(bidule)) 


(0, 75) <class 'tuple'> 
(1, -75) <class 'tuple'> 
(2, 0) <class 'tuple'> 


En fin de compte, la fonction enumerate () itére sur une série de tuples. Pouvoir séparer indice et element dans la 
boucle est possible du fait que Python autorise l’affectation multiple du style indice, element = 0, 75 (voir rubrique 
suivante). 

Dans le méme ordre d’idée, nous avons vu précédemment la méthode .dict_items() qui permettait d’itérer sur des 
couples clé / valeur d’un dictionnaire : 

>>> dico = {"pinson": 2, "merle": 3} 

>>> for cle, valeur in dico.items(): 
print(cle, valeur) 

pinson 2 

merle 3 


>>> for bidule in dico.items(): 
print (bidule, type(bidule)) 


('pinson', 2) <class 'tuple'> 
('merle', 3) <class 'tuple'> 


La méthode .dict_items() itére comme enumerate () sur une série de tuples. 
De la même façon, on peut itérer sur 3 valeurs en même temps à partir d’une liste de tuples de 3 éléments : 


>>> liste = [(i, i+1, i+2) for i in range(5, 8)] 
>>> liste 

[(5, 6, 7), (6, 7, 8), (7, 8, 9)] 

>>> for x, y, z in liste: 

print(x, y, z) 


Non 
OND: : 
(0 © 


On pourrait concevoir la même chose sur 4, 5... éléments. La seule contrainte est d’avoir une correspondance systématique 
entre le nombre de variables d’itération (par exemple 3 variables dans l’exemple ci-dessus avec x, y, z) et la longueur de 
chaque sous-tuple de la liste sur laquelle on itére (chaque sous-tuple a 3 éléments ci-dessus). 


13.2.3 Affectation multiple et le nom de variable _ 


L’affectation multiple est un mécanisme très puissant et important en Python. Pour rappel, il permet d’effectuer sur une 
même ligne plusieurs affectations en même temps, par exemple : x, y, z = 1, 2, 3. Cette syntaxe correspond à un tuple 
de chaque côté de l’opérateur =. Notez qu’il serait possible de le faire également avec les listes : [x, y, z] = [1, 2, 3]. 
Toutefois, cette syntaxe est alourdie par la présence des crochets. On préfèrera donc la première syntaxe avec les tuples sans 
parenthèse. 


Remarque 

Nous avons appelé l’opération x, y, z = 1, 2, 3 affectation multiple pour signifier que l’on affectait des valeurs à 
plusieurs variables en même temps. Toutefois, vous pourrez rencontrer aussi l’expression tuple unpacking que l’on pourrait 
traduire par « désempaquetage de tuple ». Cela signifie que l’on décompose le tuple initial 1, 2, 3 en 3 variables différentes. 


Nous avions croisé l’importance de |’ affectation multiple dans le chapitre 9 Fonctions lorsqu’une fonction renvoyait plu- 
sieurs valeurs. 


>>> def ma_fonction(): 
return 3, 14 


>>> x, y = ma_fonction() 
>>> print(x, y) 
3 14 
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La syntaxe x, y = ma_fonction() permet de récupérer les 2 valeurs renvoyées par la fonction et de les affecter à la 
volée dans 2 variables différentes. Cela évite l’opération laborieuse de récupérer d’abord le tuple, puis de créer les variables 
en utilisant l’indiçage : 


>>> resultat = ma_fonction() 
>>> resultat 


(3, 14) 

>>> x = resultat [0] 
>>> y = resultat [1] 
>>> print(x, y) 

3 14 


Conseil 
Lorsqu’une fonction renvoie plusieurs valeurs sous forme de tuple, ce sera bien sûr la forme x, y = ma_fonction() 
qui sera privilégiée. 


Quand une fonction renvoie plusieurs valeurs mais que l’on ne souhaite pas les utiliser toutes dans la suite du code, on 
peut utiliser le nom de variable _ (caractère underscore) pour indiquer que certaines valeurs ne nous intéressent pas : 


>>> def ma_fonction(): 
RP return 1, 2, 3, 4 


>>> xX, _, y, = ma_fonction() 
>>> x 

1 

>>> y 

3 


Cela envoie le message à celui qui lit le code « je me fiche des valeurs récupérées dans ces variables _ ». Notez que 
l’on peut utiliser une ou plusieurs variables underscores(s). Dans l’exemple ci-dessus, la 2e et la 4e variable renvoyées par la 
fonction seront ignorées dans la suite du code. Cela a le mérite d’éviter la création de variables dont on ne se sert pas. 


Remarque 
Dans l’interpréteur interactif, la variable _ a une signication différente. Elle prend automatiquement la dernière valeur 


affichée : 


>>> 3 

3 

>>> 

3 

>>> "mésange" 
'mésange' 

>>> 


'mésange 


Attention, cela n’est vrai que dans l’interpréteur ! 


Remarque 

Le caractère underscore (_) est couramment utilisé dans les noms de variable pour séparer les mots et être explicite, par 
exemple seq_ADN ou liste_listes_residus. On verra dans le chapitre 15 Bonnes pratiques en programmation Python 
que ce style de nommage est appelé snake_case. Toutefois, il faut éviter d’utiliser les underscores en début et/ou en fin de 
nom de variable (par exemple : _var,var_,__var, __var__). On verra au chapitre 19 Avoir la classe avec les objets que ces 
underscores ont aussi une signification particulière. 


13.3 Sets 


Les containers de type set représentent un autre type d’ objet séquentiel qui peut se révéler très pratique. Ils ont la particu- 
larité d’être non modifiables, non ordonnés et de ne contenir qu’une seule copie maximum de chaque élément. Pour créer un 
nouveau sef on peut utiliser les accolades : 


Cours de Python / Université de Paris / UFR Sciences du Vivant 


13.3. Sets 


Chapitre 13. Dictionnaires, tuples et sets 


>>> s = {1, 2, 3, 3} 
>>> s 

{1, 2, 3} 

>>> type(s) 

<class 'set'> 


Remarquez que la répétition du 3 dans la définition du set en ligne 1 donne au final un seul 3 car chaque élément ne peut 
être présent qu’une seule fois. A quoi différencie-t-on un set d’un dictionnaire alors que les deux utilisent des accolades ? Le 


set sera défini seulement par des valeurs {valeur_1, valeur_2, 


clé/valeur (clé_1: valeur_1, clé 2: valeur_2, ...}. 


...} alors que le dictionnaire aura toujours des couples 


En général, on utilisera la fonction interne à Python set() pour générer un nouveau set. Celle-ci prend en argument 
n’importe quel objet itérable et le convertit en set (opération de casting) : 


>>> set([1, 2, 4, 1]) 
{1, 2, 4} 

>>> set((2, 2, 2, 1)) 
{1, 2} 

>>> set (range (5)) 

10, 1, 2, 3, 4} 


>>> set ({"clé_1": 1, "clé_2": 2}) 
{'clé_1', 'clé_2'} 

>>> set(["ti", "to", "to"]) 
{'ti', 'to'} 


>>> set("Maître corbeau sur un arbre perché") 
Ph’, UC OU Ebo", ' Ss 'M', 'a', yes 1 ! 


130, 's', Noe; try 


Nous avons dit plus haut que les sets ne sont pas ordonnés, il est donc impossible de récupérer un élément par sa position. 


Il est également impossible de modifier un de ses éléments. 


>>> s = set([1, 2, 4, 1]) 
>>> s[1] 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
TypeError: 'set' object is not subscriptable 


Par contre, les sets sont itérables : 


>>> for element in s: 
print(element) 


1 
2 
4 


Les containers de type set sont très utiles pour rechercher les éléments uniques d'une suite d’éléments. Cela revient à 


éliminer tous les doublons. Par exemple : 


>>> import random 

>>> liste = [random.randint(0, 
>>> liste 

[7, 9, 6, 6, 7, 3, 8, 5, 6, 7] 
>>> set(liste) 

13, 5, 6, 7, 8, 9) 


9) for i in range(10)] 


On peut bien sûr transformer dans l’autre sens un set en liste. Cela permet par exemple d’éliminer les doublons de la liste 


initiale tout en récupérant une liste à la fin : 


>>> list(set([7, 9, 6, 6, 7, 3, 8, 5, 6, 
[3, 5, 6, 7, 8, 9] 


71)) 


On peut faire des choses trés puissantes. Par exemple, un compteur de lettres en combinaison avec une liste de compré- 


hension, le tout en une ligne! 


>>> seq = 
>>> set (seq) 

{'c', 'g', NE LUN 
>>> [(base, 
[C'c', 15), 


‘a'} 


C'g', 10), ('t', 11), ('a', 10)] 


seq.count(base)) for base in set(seq)] 


"atctcgatcgatcgcgctagctagctcgccatacgtacgactacgt" 


Les sets permettent aussi l’évaluation d’ union ou d’intersection mathématiques en conjonction avec les opérateurs respec- 


tivement | et & : 
>>> liste 1 = [3, 3, 5, 1, 3, 4, 1, 1, 4, 4] 
>>> liste 2 = [3, 0, 5, 3, 3, 1, 1, 1, 2, 2] 
>>> set(liste_1) | set(liste_2) 
10% 14 2, 3, 4, 5} 
>>> set(liste_1) & set(liste_2) 
{1, 3, 5} 
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Chapitre 13. Dictionnaires, tuples et sets 13.4. Dictionnaires et sets de compréhension 


Conseil 
Pour aller plus loin, vous pouvez consulter deux articles sur les sites programiz | et towardsdatascience ?. 


13.4 Dictionnaires et sets de compréhension 


Conseil : pour les débutants, vous pouvez passer cette rubrique. 

Nous avons vu au chapitre 11 Plus sur les listes les listes de compréhension. Il est également possible de générer des 
dictionnaires de compréhension : 

>>> dico = {"a": 10, "g": 10, "t": 11, "c": 15} 

>>> dico.items() 

dict_items([('a', 10), ('g', 10), ('t', 11), ('c', 15)]) 
>>> {key:val*2 for key, val in dico.items()} 

(at: 20, ‘gts 20, "Er 22, Vets 80} 

Avec un dictionnaire de compréhension, on peut rapidement compter le nombre de chaque base dans une séquence 

ADN: 
>>> seq = "atctcgatcgatcgcgctagctagctcgccatacgtacgactacgt" 
>>> {base:seq.count(base) for base in set(seq)} 
{'a': 10, 'g': 10, 't': 11, 'c': 15) 

De manière générale, tout objet sur lequel on peut faire une double itération du type for vari, var2 in obj est 
utilisable pour créer un dictionnaire de compréhension. Si vous souhaitez aller plus loin, vous pouvez consulter cet article * 
sur le site Datacamp. 

Il est également possible de générer des sets de compréhension sur le même modèle que les listes de compréhension : 

>>> {i for i in range(10)} 
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9} 


>>> {i**2 for i in range(10)} 
{0, 1, 64, 4, 36, 9, 16, 49, 81, 25} 


13.5 Module collections 


Conseil : pour les débutants, vous pouvez passer cette rubrique. 

Le module collections * contient d’autres types de containers qui peuvent se révéler utiles, c’est une véritable mine d’or! 
Nous n’aborderons pas tous ces objets ici, mais nous pouvons citer tout de même certains d’entre eux si vous souhaitez aller 
un peu plus loin : 

— les dictionnaires ordonnés * qui se comportent comme les dictionnaires classiques mais qui sont ordonnés ; 

— les defaultdicts * permettant de générer des valeurs par défaut quand on demande une clé qui n’existe pas (cela évite 

que Python génère une erreur) ; 

— les compteurs ’ dont un exemple est montré ci-dessous ; 

— les namedtuples Ÿ que nous évoquerons au chapitre 19 Avoir la classe avec les objets. 

L'objet collection.Counter() est particulièrement intéressant et simple à utiliser. Il crée des compteurs à partir d’ ob- 
jets itérables, par exemple : 


>>> import collections 

>>> compo_seq = collections.Counter ("aatctccgatcgatcgatcgatgatc") 
>>> compo_seq 

Counter ({'a': 7, 't': 7, 'c': 7, 'g': 57) 

>>> type(compo_seq) 

<class 'collections.Counter '> 

>>> compo_seq["a"] 

7 


. https: //www.programiz.com/python-programming/set 

. https: //towardsdatascience.com/python-sets-and-set-theory-2ace093d1607 

. https: //www.datacamp.com/community/tutorials/python-dictionary-comprehension 
. https: //docs.python.org/fr/3/library/collections.html 
https://docs.python.org/fr/3/library/collections.html#collections.0rderedDict 
https://docs.python.org/fr/3/library/collections.html#collections.defaultdict 
https://docs.python.org/fr/3/library/collections.html#collections.Counter 

. https://docs.python.org/fr/3/library/collections.html#collections.namedtuple 
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>>> compo_seq["n"] 
0 


Dans cet exemple, Python a automatiquement compté chaque caractère a, t, g et c de la chaîne de caractères passée en 
argument. Cela crée un objet de type Counter qui se comporte ensuite comme un dictionnaire, à une exception près : si on 
appelle une clé qui n’existe pas dans l’itérable initiale (comme le n ci-dessus) la valeur renvoyée est 0. 


13.6 Exercices 


Conseil : pour ces exercices, créez des scripts puis exécutez-les dans un shell. 


13.6.1 Composition en acides aminés 


En utilisant un dictionnaire, déterminez le nombre d’ occurrences de chaque acide aminé dans la séquence AGWPSGGASAGLAILWGASAIMPG 
Le dictionnaire ne doit contenir que les acides aminés présents dans la séquence. 


13.6.2 Mots de 2 et 3 lettres dans une séquence d’ADN 


Créez une fonction compte_mots_2_lettres() qui prend comme argument une séquence sous la forme d’une chaîne de 
caractères et qui renvoie tous les mots de 2 lettres qui existent dans la séquence sous la forme d’un dictionnaire. Par exemple 
pour la séquence ACCTAGCCCTA, le dictionnaire renvoyée serait: {'AC': 1, 'CC': 3, 'CT': 2, 'TA': 2, 'AG': 1, 
'GC': 1} 

Créez une nouvelle fonction compte_mots_3_lettres() qui a un comportement similaire à compte_mots_2_lettres() 
mais avec des mots de 3 lettres. 

Utilisez ces fonctions pour affichez les mots de 2 et 3 lettres et leurs occurrences trouvés dans la séquence ď ADN : 
ACCTAGCCATGTAGAATCGCCTAGGCTTTAGCTAGCTCTAGCTAGCTG 

Voici un exemple de sortie attendue : 


Mots de 2 lettres 


AG : 1 

cc : 3 

CT : 8 

Éd 

Mots de 3 lettres 
ACC : i 

CCT : 2 

CTA : 5 


Eora] 


13.6.3 Mots de 2 lettres dans la séquence du chromosome I de Saccharomyces cerevisiae 


Créez une fonction lit_fasta() qui prend comme argument le nom d’un fichier FASTA sous la forme d’une chaîne de 
caractères, lit la séquence dans le fichier FASTA et la renvoie sous la forme d’une chaîne de caractères. N'hésitez pas à vous 
inspirer d’un exercice similaire du chapitre 10 Plus sur les chaînes de caractères. 

Utilisez cette fonction et la fonction compte _mots_2_lettres() de l’exercice précédent pour extraire les mots de 2 
lettres et leurs occurrences dans la séquence du chromosome I de la levure du boulanger Saccharomyces cerevisiae (fichier 
NC_001133. fna’). 

Le génome complet est fourni au format FASTA. Vous trouverez des explications sur ce format et des exemples de code 
dans l’annexe A Quelques formats de données rencontrés en biologie. 


13.6.4 Mots de n lettres dans un fichier FASTA 


Créez un script extract-words.py qui prend comme arguments le nom d’un fichier FASTA suivi d’un entier compris 
entre 1 et 4. Ce script doit extraire du fichier FASTA tous les mots et leurs occurrences en fonction du nombre de lettres passé 
en option. 
Utilisez pour ce script la fonction 1it_fasta () de l’exercice précédent. Créez également la fonction compte_mots_n_lettres() 
qui prend comme argument une séquence sous la forme d’une chaîne de caractères et le nombre de lettres des mots sous la 
forme d’un entier. 


9. https://python.sdv.univ-paris-diderot.fr/data-files/NC_001133.fna 
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Testez ce script avec : 

— la séquence du chromosome I de la levure du boulanger Saccharomyces cerevisiae (fichier NC_001133.fna 10) 
— le génome de la bactérie Escherichia coli (fichier NC_000913.fna ih 

Les deux fichiers sont au format FASTA. 

Cette méthode vous paraít-elle efficace sur un génome assez gros comme celui d’ Escherichia coli? 


13.6.5 Atomes carbone alpha d’un fichier PDB 


Téléchargez le fichier 1bta.pdb !? qui correspond à la structure tridimensionnelle de la protéine barstar !* sur le site de la 
Protein Data Bank (PDB). 

Créez la fonction trouve_calpha() qui prend en argument le nom d’un fichier PDB (sous la forme d’une chaîne de 
caractères), qui sélectionne uniquement les lignes contenant des carbones alpha et qui les renvoie sous la forme d’une liste de 
dictionnaires. Chaque dictionnaire contient quatre clés : 

— le numéro du résidu (resid) avec une valeur entière, 

— la coordonnée atomique x (x) avec une valeur float, 

— la coordonnée atomique y (y) avec une valeur float, 

— la coordonnée atomique z (z) avec une valeur float. 

Utilisez la fonction trouve_calpha() pour afficher à l’écran le nombre total de carbones alpha de la barstar ainsi que les 
coordonnées atomiques des carbones alpha des deux premiers résidus (acides aminés). 

Conseil : vous trouverez des explications sur le format PDB et des exemples de code pour lire ce type de fichier en Python 
dans l’annexe A Quelques formats de données rencontrés en biologie. 


13.6.6 Barycentre d’une protéine (exercice +++) 


Téléchargez le fichier 1bta.pdb !4 qui correspond à la structure tridimensionnelle de la protéine barstar !> sur le site de la 
Protein Data Bank (PDB). 

Un carbone alpha est présent dans chaque résidu (acide aminé) d’une protéine. On peut obtenir une bonne approximation 
du barycentre d’une protéine en calculant le barycentre de ses carbones alpha. 

Le barycentre G de coordonnées (Gx, Gy, Gz) est obtenu à partir des n carbones alpha (CA) de coordonnées (CA,, CAy, 
CA,) avec : 


1 n 
G=- } CA; 
1 n 
G=- L CA, 
n iZ 

n 
G.=- Y CA;, 


ni 


Créez une fonction calcule_barycentre() qui prend comme argument une liste de dictionnaires dont les clés (resid, 
x, y et z) sont celles de l’exercice précédent et qui renvoie les coordonnées du barycentre sous la forme d’une liste de floats. 
Utilisez la fonction trouve_calpha() de l’exercice précédent et la fonction 
calcule_barycentre () pour afficher, avec deux chiffres significatifs, les coordonnées du barycentre des carbones alpha de 
la barstar. 


10. https://python.sdv.univ-paris-diderot.fr/data-files/NC_001133.fna 
11. https://python.sdv.univ-paris-diderot.fr/data-files/NC_000913.fna 
12. https://files.rcsb.org/download/1BTA.pdb 

13. http://www.rcsb.org/pdb/explore.do?structureId=1BTA 

14. https://files.rcsb.org/download/1BTA.pdb 

15. http://www.rcsb.org/pdb/explore.do?structureld=1BTA 
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Création de modules 


14.1 Pourquoi créer ses propres modules ? 


Dans le chapitre 8 Modules, nous avons découvert quelques modules existants dans Python comme random, math, etc. 
Nous avons vu par ailleurs dans les chapitres 9 Fonctions et 12 Plus sur les fonctions que les fonctions sont utiles pour 
réutiliser une fraction de code plusieurs fois au sein d’un même programme sans avoir à dupliquer ce code. On peut imaginer 
qu’une fonction bien écrite pourrait être judicieusement réutilisée dans un autre programme Python. C’est justement I’ intérét 
de créer un module. On y met un ensemble de fonctions que l’on peut être amené à utiliser souvent. En général, les modules 
sont regroupés autour d’un thème précis. Par exemple, on pourrait concevoir un module d’analyse de séquences biologiques 
ou encore de gestion de fichiers PDB. 


14.2 Création d’un module 


En Python, la création d’un module est très simple. Il suffit d'écrire un ensemble de fonctions (et/ou de constantes) dans 
un fichier, puis d’enregistrer ce dernier avec une extension .py (comme n’importe quel script Python). A titre d’exemple, nous 
allons créer un module simple que nous enregistrerons sous le nom message. py : 


"""Module inutile qui affiche des messages :-).""" 


DATE = 16092008 


def bonjour (nom): 
MMA Di Bonjour ." nn 
return "Bonjour " + nom 


def ciao(nom): 
MED TT Ciao nnn 
return "Ciao " + nom 


def hello(nom): 
nun pit Hello.""" 
return "Hello " + nom 


Les chaînes de caractères entre triple guillemets en tête du module et en tête de chaque fonction sont facultatives mais 
elles jouent néanmoins un rôle essentiel dans la documentation du code. 


Remarque 
Une constante est, par définition, une variable dont la valeur n’est pas modifiée. Par convention en Python, le nom des 
constantes est écrit en majuscules (comme DATE dans notre exemple). 
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14.3 Utilisation de son propre module 


Pour appeler une fonction ou une variable de ce module, il faut que le fichier message.py soit dans le répertoire courant 
(dans lequel on travaille) ou bien dans un répertoire listé par la variable d’environnement PYTHONPATH de votre système 
d'exploitation. Ensuite, il suffit d'importer le module et toutes ses fonctions (et constantes) vous sont alors accessibles. 


Remarque 
Avec Mac OS X et Linux, il faut taper la commande suivante depuis un shell Bash pour modifier la variable d’environne- 
ment PYTHONPATH : 
export PYTHONPATH=$PYTHONPATH: /chemin/vers/mon/super/module 
Avec Windows, mais depuis un shell PowerShell, il faut taper la commande suivante : 
$env:PYTHONPATH += ";C:\chemin\vers\mon\super\module" 
Une fois cette manipulation effectuée, vous pouvez contrôler que le chemin vers le répertoire contenant vos modules a 
bien été ajouté à la variable d’ environnement PYTHONPATH : 
— sous Mac OS X et Linux: echo $PYTHONPATH 
— sous Windows: echo $env:PYTHONPATH 


Le chargement du module se fait avec la commande import message. Notez que le fichier est bien enregistré avec une 
extension .py et pourtant on ne la précise pas lorsqu’on importe le module. Ensuite, on peut utiliser les fonctions comme avec 
un module classique. 


>>> import message 


>>> message.hello("Joe") 

"Hello Joe' 

>>> message.ciao("Bill") 

"Ciao Bill' 

>>> message. bonjour ("Monsieur") 
"Bonjour Monsieur 

>>> message.DATE 

16092008 


Remarque 
La première fois qu’un module est importé, Python crée un répertoire nommé __pycache__ contenant un fichier avec une 
extension .pyc qui contient le bytecode !, c’est-à-dire le code précompilé du module. 


14.4 Les docstrings 


Lorsqu'on écrit un module, il est important de créer de la documentation pour expliquer ce que fait le module et comment 
utiliser chaque fonction. Les chaînes de caractères entre triple guillemets situées en début du module et de chaque fonction 
sont lá pour cela, on les appelle docstrings (« chaînes de documentation » en français). Ces docstrings permettent notamment 
de fournir de l’aide lorsqu’on invoque la commande he1lp() : 


>>> help(message) 
Help on module message: 


NAME 
message - Module inutile qui affiche des messages :-). 


FUNCTIONS 
bonjour (nom) 
Dit Bonjour. 


ciao(nom) 
Dit Ciao. 


hello(nom) 
Dit Hello. 


DATA 
DATE = 16092008 


1. https://docs.python.org/fr/3/glossary.html 
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FILE 
/home/pierre/message.py 


Remarque 
Pour quitter l’aide, pressez la touche Q. 


Vous remarquez que Python a généré automatiquement cette page d’aide, tout comme il est capable de le faire pour les 
modules internes à Python (random, math, etc.) et ce grâce aux docstrings. Notez que l’on peut aussi appeler l’aide pour une 
seule fonction : 


>>> help(message.ciao) 


Help on function ciao in module message: 


ciao(nom) 
Dit Ciao. 

En résumé, les docstrings sont destinés aux utilisateurs du module. Leur but est différent des commentaires qui, eux, sont 
destinés à celui qui lit le code (pour en comprendre les subtilités). Une bonne docstring de fonction doit contenir tout ce dont 
un utilisateur a besoin pour utiliser cette fonction. Une liste minimale et non exhaustive serait : 

— ce que fait la fonction, 

— ce qu’elle prend en argument, 

— ce qu’elle renvoie. 

Pour en savoir plus sur les docstrings et comment les écrire, nous vous recommandons de lire le chapitre 15 Bonnes 
pratiques en programmation Python. 


145 Visibilité des fonctions dans un module 


La visibilité des fonctions au sein des modules suit des règles simples : 

— Les fonctions dans un même module peuvent s’appeler les unes les autres. 

— Les fonctions dans un module peuvent appeler des fonctions situées dans un autre module s’il a été préalablement 
importé. Par exemple, si la commande import autremodule est utilisée dans un module, il est possible d’appeler 
une fonction avec autremodule.fonction(). 

Toutes ces règles viennent de la manière dont Python gère les espaces de noms. De plus amples explications sont données 

sur ce concept dans le chapitre 19 Avoir la classe avec les objets. 


14.6 Module ou script ? 


Vous avez remarqué que notre module message ne contient que des fonctions et une constante. Si on l’exécutait comme 
un script classique, cela n’afficherait rien : 


$ python message.py 
$ 


Cela s’explique par l’absence de programme principal, c’est-à-dire, de lignes de code que l’interpréteur exécute lorsqu’on 
lance le script. 

À l'inverse, que se passe-t-il alors si on importe un script en tant que module alors qu'il contient un programme principal 
avec des lignes de code ? Prenons par exemple le script message2.py suivant : 


nan Script de test. """ 


def bonjour (nom): 
"""Dit Bonjour. 
return "Bonjour " + nom 


# programme principal 
print (bonjour ("Joe")) 


Si on l’importe dans l’interpréteur, on obtient : 
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>>> import message2 
Bonjour Joe 
Ceci n’est pas le comportement voulu pour un module car on n’attend pas d’affichage particulier (par exemple la com- 
mande import math n’affiche rien dans l’interpréteur). 
Afin de pouvoir utiliser un code Python en tant que module ou en tant que script, nous vous conseillons la structure 
suivante : 


“un Script de test.""" 


def bonjour (nom): 
"""Dit Bonjour. 
return "Bonjour 


" + nom 


if __name__ == "__main__": 


print (bonjour ("Joe")) 


À la ligne 9, instruction if __name__ == "__main__": indique à Python: 
— Si le programme message2. py est exécuté en tant que script dans un shell, le résultat du test if sera alors True et le 
bloc d’instructions correspondant (ligne 10) sera exécuté : 


$ python message2.py 

Bonjour Joe 

— Si le programme message2.py est importé en tant que module, le résultat du test if sera alors False et le bloc 
d’ instructions correspondant ne sera pas exécuté : 

>>> import message2 

>>> 

À nouveau, ce comportement est possible grâce à la gestion des espaces de noms par Python (pour plus détails, consultez 
le chapitre 19 Avoir la classe avec les objets). 

Au delà de la commodité de pouvoir utiliser votre script en tant que programme ou en tant que module, cela présente 
l’avantage de signaler clairement où se situe le programme principal quand on lit le code. Ainsi, plus besoin d’ajouter un 
commentaire # programme principal comme nous vous l’avions suggéré dans les chapitres 9 Fonctions et 12 Plus sur les 
fonctions. L'utilisation de la ligne if __name__ == "__main__": est une bonne pratique que nous vous recommandons ! 


14.7 Exercice 


14.7.1 Module ADN 


Dans le script adn. py, construisez un module qui va contenir les fonctions et constantes suivantes. 

— Fonction 1it_fasta() : prend en argument un nom de fichier sous forme d’une chaîne de caractères et renvoie la 
séquence d’ADN lue dans le fichier sous forme d’une chaine de caractères. 

— Fonction seq_alea() : prend en argument une taille de séquence sous forme d’un entier et renvoie une séquence 
aléatoire d’ ADN de la taille correspondante sous forme d’une chaîne de caractères. 

— Fonction comp_inv() : prend en argument une séquence d' ADN sous forme d’une chaîne de caractères et renvoie la 
séquence complémentaire inverse (aussi sous forme d’une chaîne de caractères). 

— Fonction prop_gc() : prend en argument une séquence d’ADN sous forme d’une chaîne de caractères et renvoie la 
proportion en GC de la séquence sous forme d’un float. Nous vous rappelons que la proportion de GC s’ obtient comme 
la somme des bases Guanine (G) et Cytosine (C) divisée par le nombre total de bases (A, T, C, G). 

— Constante BASE_COMP : dictionnaire qui contient la complémentarité des bases d ADN (AT, T—C, G—C et C—G). 
Ce dictionnaire sera utilisé par la fonction comp_inv(). 

À la fin de votre script, proposez des exemples d’utilisation des fonctions que vous aurez créées. Ces exemples d’utilisation 

ne devront pas être exécutés lorsque le script est chargé comme un module. 

Conseils : 

— Dans cet exercice, on supposera que toutes les séquences sont manipulées comme des chaînes de caractères en majus- 
cules. 

— Pour les fonctions seq_alea() et comp_inv(), n’hésitez pas à jeter un ceil aux exercices correspondants dans le 
chapitre 11 Plus sur les listes. 

— Voici un exemple de fichier FASTA adn. fasta? pour tester la fonction 1it_fasta(). 


2. https://python.sdv.univ-paris-diderot.fr/data-files/adn.fasta 
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Chapitre 15 


Bonnes pratiques en programmation Python 


Comme vous l’avez constaté dans tous les chapitres précédents, la syntaxe de Python est très permissive. Afin d’unifor- 
miser l’écriture de code en Python, la communauté des développeurs Python recommande un certain nombre de règles afin 
qu’un code soit lisible. Lisible par quelqu’un d’ autre, mais également, et surtout, par soi-même. Essayez de relire un code que 
vous avez écrit « rapidement » il y a un 1 mois, 6 mois ou un an. Si le code ne fait que quelques lignes, il se peut que vous 
vous y retrouviez, mais s’il fait plusieurs dizaines voire centaines de lignes, vous serez perdus. 

Dans ce contexte, le créateur de Python, Guido van Rossum, part d’un constat simple : « code is read much more often than 
it is written » (« le code est plus souvent lu qu’écrit »). Avec l’expérience, vous vous rendrez compte que cela est parfaitement 
vrai. Alors plus de temps a perdre, voyons en quoi consistent ces bonnes pratiques. 

Plusieurs choses sont nécessaires pour écrire un code lisible : la syntaxe, l’organisation du code, le découpage en fonctions 
(et possiblement en classes que nous verrons dans le chapitre 19 Avoir la classe avec les objets), mais souvent, aussi, le bon 
sens. Pour cela, les « PEP » peuvent nous aider. 


Définition 

Afin d'améliorer le langage Python, la communauté qui développe Python publie régulièrement des Python Enhance- 
ment Proposal! (PEP), suivi d’un numéro. Il s’agit de propositions concrètes pour améliorer le code, ajouter de nouvelles 
fonctionnalités, mais aussi des recommandations sur la manière d’utiliser Python, bien écrire du code, etc. 


On va aborder dans ce chapitre sans doute la plus célèbre des PEP, à savoir la PEP 8, qui est incontournable lorsque l’on 
veut écrire du code Python correctement. 


Définition 
On parle de code pythonique lorsque ce dernier respecte les règles d’écriture définies par la communauté Python mais 
aussi les règles d’usage du langage. 


15.1 De la bonne syntaxe avec la PEP 8 


La PEP 8 Style Guide for Python Code? est une des plus anciennes PEP (les numéros sont croissants avec le temps). Elle 
consiste en un nombre important de recommandations sur la syntaxe de Python. Il est vivement recommandé de lire la PEP 8 
en entier au moins une fois pour avoir une bonne vue d’ensemble. On ne présentera ici qu’un rapide résumé de cette PEP 8. 


15.1.1 Indentation 


On a vu que l’indentation est obligatoire en Python pour séparer les blocs d’instructions. Cela vient d’un constat simple, 
l’indentation améliore la lisibilité d’un code. Dans la PEP 8, la recommandation pour la syntaxe de chaque niveau d’indentation 
est très simple : 4 espaces. N'utilisez pas autre chose, c’est le meilleur compromis. 


1. https: //www.python.org/dev/peps/ 
2. https: //www.python.org/dev/peps/pep-0008/ 
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Attention 

Afin de toujours utiliser cette règle des 4 espaces pour l'indentation, il est essentiel de régler correctement votre éditeur 
de texte. Consultez pour cela l’annexe Installation de Python disponible en ligne *. Avant d’écrire la moindre ligne de code, 
faites en sorte que lorsque vous pressez la touche tabulation, cela ajoute 4 espaces (et non pas un caractère tabulation). 


15.1.2 Importation des modules 


Comme on l’a vu au chapitre 8 Modules, le chargement d’un module se fait avec l’instruction import module plutôt 
qu'avec from module import *. 
Si on souhaite ensuite utiliser une fonction d’un module, la première syntaxe conduit à module .fonction() ce qui rend 
explicite la provenance de la fonction. Avec la seconde syntaxe, il faudrait écrire fonction() ce qui peut : 
— mener à un conflit si une de vos fonctions a le même nom; 
— rendre difficile la recherche de documentation si on ne sait pas d’où vient la fonction, notamment si plusieurs modules 
sont chargés avec l’instruction 
from module import * 
Par ailleurs, la première syntaxe définit un « espace de noms » (voir chapitre 19 Avoir la classe avec les objets) spécifique 
au module. 
Dans un script Python, on importe en général un module par ligne. D’abord les modules internes (classés par ordre 
alphabétique), c’est-à-dire les modules de base de Python, puis les modules externes (ceux que vous avez installés en plus). 
Si le nom du module est trop long, on peut utiliser un alias. L’instruction from est tolérée si vous n’importez que quelques 
fonctions clairement identifiées. 
En résumé : 


import module _interne _1 

import module _interne_2 

from module _interne_3 import fonction _ spécifique 

from module _interne_4 import constante _1, fonction_1, fonction _2 


import module_externe_1 
import module_externe_2 
import module _externe_3_qui_a_un_nom_long as mod3 


15.1.3 Règles de nommage 


Les noms de variables, de fonctions et de modules doivent être de la forme : 


ma_variable 
fonction_test_27() 
mon_module 


c’est-à-dire en minuscules avec un caractère « souligné » (« tiret du bas » ou underscore en anglais) pour séparer les 
différents « mots » dans le nom. 
Les constantes sont écrites en majuscules : 


MA_CONSTANTE 
VITESSE_LUMIERE 
Les noms de classes (chapitre 19) et les exceptions (chapitre 21) sont de la forme : 


MaClasse 
MyException 


Remarque 
Le style recommandé pour nommer les variables et les fonctions en Python est appelé snake_case. Il est différent du 
CamelCase utilisé pour les noms des classes et des exceptions. 


Pensez à donner à vos variables des noms qui ont du sens. Evitez autant que possible les a1, a2, i, truc, toto... Les 
noms de variables à un caractère sont néanmoins autorisés pour les boucles et les indices : 


3. https://python.sdv.univ-paris-diderot.fr/livre-dunod 
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>>> ma_liste = [1, 3, 5, 7, 9, 11] 
>>> for i in range(len(ma_liste)): 
print (ma_liste[i]) 
Bien sûr, une écriture plus « pythonique » de l’exemple précédent permet de se débarrasser de l’indice i : 


>>> ma_liste = [1, 3, 5, 7, 9, 11] 
>>> for entier in ma_liste: 
print (entier) 


Enfin, des noms de variable à une lettre peuvent être utilisés lorsque cela a un sens mathématique (par exemple, les noms 
x, y et z évoquent des coordonnées cartésiennes). 


15.1.4 Gestion des espaces 


La PEP 8 recommande d’entourer les opérateurs (+, —, /, *, ==, !=, >=, not, in, and, or...) d’un espace avant et d'un 
espace après. Par exemple : 


# code recommandé 


ma_variable = 3 + 7 
mon_texte = "souris" 
mon_texte == ma_variable 


# code non recommandé 
ma_variable=3+7 
mon_texte="souris" 
mon_texte== ma_variable 


Il n’y a, par contre, pas d'espace à l’intérieur de crochets, d'accolades et de parenthèses : 


# code recommandé 
ma_liste [1] 
mon_dico{"clé"} 
ma_fonction(argument) 

# code non recommandé 
ma_liste[ 1 ] 
mon_dico{"clé" } 
ma_fonction( argument ) 


Ni juste avant la parenthèse ouvrante d’une fonction ou le crochet ouvrant d’une liste ou d’un dictionnaire : 


# code recommandé 
ma_liste [1] 
mon_dico{"clé"} 
ma_fonction(argument) 
# code non recommandé 
ma_liste [1] 

mon_dico {"clé"} 
ma_fonction (argument) 


On met un espace après les caractères : et , (mais pas avant) : 


# code recommandé 

ma_liste = [1, 2, 3] 

mon_dico = {"cléi": "valeuri", "clé2": "valeur2"} 
ma_fonction(argumenti, argument2) 

# code non recommandé : 

ma_liste = [1 , 2 ,3] 

mon_dico = {"cléi": "valeuri", "clé2": "valeur2"} 
ma_fonction(argumenti ,argument2) 


Par contre, pour les tranches de listes, on ne met pas d’espace autour du : 


ma_liste = [1, 3, 5, 7, 9, 1] 
# code recommandé 
ma_liste[1:3] 

ma_liste[1:4:2] 

ma_liste[::2] 

# code non recommandé 
ma_listeli : 3] 

ma_liste[i: 4:2 ] 

ma_listel : :2] 


Enfin, on n’ajoute pas plusieurs espaces autour du = ou des autres opérateurs pour faire joli : 


# code recommandé 


xí = 1 
x2 = 3 
x_old = 5 
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# code non recommandé 


x1 = 1 
x2 = 3 
x_old = 5 


15.1.5 Longueur de ligne 


Une ligne de code ne doit pas dépasser 79 caractéres, pour des raisons tant historiques que de lisibilité. 
On a déjà vu au chapitre 1 Introduction que le caractère \ permet de couper des lignes trop longues. Par exemple : 


>>> ma_variable = 3 
>>> if ma_variable > 1 and ma_variable < 10 \ 
and ma_variable % 2 == 1 and ma_variable % 3 == 0: 


print(f"ma variable vaut {ma_variable}") 


ma variable vaut 3 


A l’intérieur d’une parenthèse, on peut revenir à la ligne sans utiliser le caractère \. C’est particulièrement utile pour 
préciser les arguments d’une fonction ou d’une méthode, lors de sa création ou lors de son utilisation : 


>>> def ma_fonction(argument_1, argument _2, 
argument _3, argument _4): 
return argument_1 + argument _2 


>>> ita Anton (conte trés long", "tigre" 
"singe", "souris") 
‘texte très longtigre ' 


Les parenthéses sont également trés pratiques pour répartir sur plusieurs lignes une chaine de caractéres qui sera affichée 
sur une seule ligne : 
>>> print ("ATGCGTACAGTATCGATAAC" 
" ATGACTGCTACGATCGGATA" 


"CGGGTAACGCCATGTACATT") 
ATGCGTACAGTATCGATAACATGACTGCTACGATCGGATACGGGTAACGCCATGTACATT 


Notez qu'il n’y a pas d’ opérateur + pour concaténer les trois chaînes de caractères et que celles-ci ne sont pas séparées par 
des virgules. A partir du moment ot elles sont entre parenthéses, Python les concaténe automatiquement. 
On peut aussi utiliser les parenthèses pour évaluer un expression trop longue : 


>>> ma_variable = 3 
>>> if (ma_variable > 1 and ma_variable < 10 
and ma_variable % 2 == 1 and ma_variable % 3 == 0): 


print(f"ma variable vaut {ma_variable}") 


ma variable vaut 3 


Les parenthèses sont aussi très utiles lorsqu’on a besoin d’enchainer des méthodes les unes à la suite des autres. Un 
exemple se trouve dans le chapitre 17 Quelques modules d’intérét en bioinformatique, dans la partie consacrée au module 
pandas. 


Enfin, il est possible de créer des listes ou des dictionnaires sur plusieurs lignes, en sautant une ligne aprés une virgule : 


>>> ma_liste = [1, 2, 3, 

ay 4, 5, 6, 

ne 7, 8, 9] 

>>> mon_dico = {"cléi": 13, 
"clé2": 42, 
"clé3": -10} 


15.1.6 Lignes vides 


Dans un script, les lignes vides sont utiles pour séparer visuellement les différentes parties du code. 


Il est recommandé de laisser deux lignes vides avant la définition d’une fonction ou d’une classe et de laisser une seule 
ligne vide avant la définition d’une méthode (dans une classe). 


On peut aussi laisser une ligne vide dans le corps d’une fonction pour séparer les sections logiques de la fonction, mais 
cela est à utiliser avec parcimonie. 
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15.1.7 Commentaires 


Les commentaires débutent toujours par le symbole # suivi d’un espace. Ils donnent des explications claires sur l’utilité 
du code et doivent être synchronisés avec le code, c’est-à-dire que si le code est modifié, les commentaires doivent l’être aussi 
(le cas échéant). 

Les commentaires sont sur le même niveau d’indentation que le code qu’ils commentent. Les commentaires sont constitués 
de phrases complètes, avec une majuscule au début (sauf si le premier mot est une variable qui s’écrit sans majuscule) et un 
point à la fin. 

La PEP 8 recommande très fortement d’écrire les commentaires en anglais, sauf si vous êtes à 120% sûr que votre code ne 
sera lu que par des francophones. Dans la mesure où vous allez souvent développer des programmes scientifiques, nous vous 
conseillons d’écrire vos commentaires en anglais. 

Soyez également cohérent entre la langue utilisée pour les commentaires et la langue utilisée pour nommer les variables. 
Pour un programme scientifique, les commentaires et les noms de variables sont en anglais. Ainsi ma_liste deviendra 
my_list etma_ fonction deviendra my_function (par exemple). 

Les commentaires qui suivent le code sur la même ligne sont à éviter le plus possible et doivent être séparés du code par 
au moins deux espaces : 


X = x ba # My wonderful comment. 


Remarque 
Nous terminerons par une remarque qui concerne la syntaxe, mais qui n’est pas incluse dans la PEP 8. On nous pose 
souvent la question du type de guillemets à utiliser pour déclarer une chaîne de caractères. Simples ou doubles ? 


>>> var_1 = "Ma chaîne de caracteres" 
>>> var_1 

"Ma chaîne de caractères 

>>> var_2 = 'Ma chaîne de caractères 
>>> var_2 

"Ma chaîne de caractéres' 

>>> var_1 == var_2 

True 


Vous constatez dans l’exemple ci-dessus que pour Python, c’est exactement la même chose. Et à notre connaissance, il 
n'existe pas de recommandation officielle sur le sujet. 
Nous vous conseillons cependant d’utiliser les guillemets doubles car ceux-ci sont, de notre point de vue, plus lisibles. 


15.2 Les docstrings et la PEP 257 


Les docstrings, que l’on pourrait traduire par « chaînes de documentation » en français, sont un élément essentiel de nos 
programmes Python comme on l’a vu au chapitre 14 Création de modules. À nouveau, les développeurs de Python ont émis 
des recommandations dans la PEP 8 et plus exhaustivement dans la PEP 257* sur la manière de rédiger correctement les 
docstrings. En voici un résumé succinct. 

De manière générale, écrivez des docstrings pour les modules, les fonctions, les classes et les méthodes. Lorsque l’expli- 
cation est courte et compacte comme dans certaines fonctions ou méthodes simples, utilisez des docstrings d’une ligne : 


"""Docstring simple d'une ligne se finissant par un point.""" 


Lorsque vous avez besoin de décrire plus en détail un module, une fonction, une classe ou une méthode, utilisez une 
docstring sur plusieurs lignes. 


"""Docstring de plusieurs lignes, la premiére ligne est un résumé. 


Aprés avoir sauté une ligne, on décrit les détails de cette docstring. 
blablabla 
blablabla 
blublublu 
bliblibli 


On termine la docstring avec les triples guillemets sur la ligne suivante. 
nun. 


Remarque 


4. https: //www.python.org/dev/peps/pep-0257/ 
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La PEP 257 recommande d’écrire des docstrings avec des triples doubles guillemets, c’est-à-dire 
"""Ceci est une docstring recommandée.""" 

mais pas 

'''Ceci n'est pas une docstring recommandée.'''. 


Comme indiqué dans le chapitre 14 Création de modules, n’ oubliez pas que les docstrings sont destinées aux utilisateurs 
des modules, fonctions, méthodes et classes que vous avez développés. Les éléments essentiels pour les fonctions et les 
méthodes sont : 


1. ce que fait la fonction ou la méthode, 
2. ce qu’elle prend en argument, 


3. ce qu’elle renvoie. 


Pour les modules et les classes, on ajoute également des informations générales sur leur fonctionnement. 

Pour autant, la PEP 257 ne dit pas explicitement comment organiser les docstrings pour les fonctions et les méthodes. 
Pour répondre à ce besoin, deux solutions ont émergées : 

— La solution Google avec le Google Style Python Docstrings>. 

— La solution NumPy avec le NumPy Style Python Docstrings °. NumPy qui est un module complémentaire à Python, très 

utilisé en analyse de données et dont on parlera dans le chapitre 17 Quelques modules d’intérét en bioinformatique. 

On illustre ici la solution NumPy pour des raisons de goût personnel. Sentez-vous libre d’ aller explorer la proposition de 

Google. Voici un exemple trés simple : 


def multiplie_nombres(nombrei, nombre2): 
"Multiplication de deux nombres entiers. 


Cette fonction ne sert pas à grand chose. 


Parameters 


nombrei : int 

Le premier nombre entier. 
nombre2 : int 

Le second nombre entier. 


Avec une description plus longue. 
Sur plusieurs lignes. 


Returns 


Le produit des deux nombres. 
nun 


return nombrel * nombre2 


Lignes 6 et 7. La section Parameters précise les paramètres de la fonction. Les tirets sur la ligne 7 permettent de souligner 
le nom de la section et donc de la rendre visible. 

Lignes 8 et 9. On indique le nom et le type du paramètre séparés par le caractère deux-points. Le type n’est pas obligatoire. 
En dessous, on indique une description du paramètre en question. La description est indentée. 

Lignes 10 à 14. Même chose pour le second paramètre. La description du paramètre peut s’étaler sur plusieurs lignes. 

Lignes 16 et 17. La section Returns indique ce qui est renvoyé par la fonction (le cas échéant). 


Lignes 18 et 19. La mention du type renvoyé est obligatoire. En dessous, on indique une description de ce qui est renvoyé 
par la fonction. Cette description est aussi indentée. 


Attention 

L’étre humain a une fâcheuse tendance à la procrastination (le fameux « Bah je le ferai demain... ») et écrire de la docu- 
mentation peut être un sérieux motif de procrastination. Soyez vigilant sur ce point, et rédigez vos docstrings au moment où 
vous écrivez vos modules, fonctions, classes ou méthodes. Passer une journée (voire plusieurs) à écrire les docstrings d’un 
gros projet est particulièrement pénible. Croyez-nous ! 


5. https://sphinxcontrib-napoleon.readthedocs.io/en/latest/example_google.html 
6. https: //sphinxcontrib-napoleon.readthedocs.io/en/latest/example_numpy.html 
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15.3 Outils de contrôle qualité du code 


Pour évaluer la qualité d’un code Python, c’est-à-dire sa conformité avec les recommandations de la PEP 8 et de la PEP 
257, on peut utiliser des sites internet ou des outils dédiés. 

Le site pep8online ’, par exemple, est très simple d'utilisation. On copie / colle le code à évaluer puis on clique sur le 
bouton Check code. 

Les outils pycodestyle, pydocstyle et pylint doivent par contre être installés sur votre machine. Avec la distribution 
Miniconda, cette étape d’installation se résume à une ligne de commande : 


$ conda install -c conda-forge pycodestyle pydocstyle pylint 


Définition 

Les outils pycodestyle, pydocstyle et pylint sont des linters, c’est-à-dire des programmes qui vont chercher les 
sources potentielles d’erreurs dans un code informatique. Ces erreurs peuvent être des erreurs de style (PEP 8 et 257) ou des 
erreurs logiques (manipulation d’une variable, chargement de module). 


Voici le contenu du script script_quality_not_ok.py° que nous allons analyser par la suite : 


"""Un script de multiplication. 
wow 


import os 


def Multiplie_nombres (nombrei ,nombre2 ): 
"""Multiplication de deux nombres entiers 
Cette fonction ne sert pas a grand chose. 


Parameters 


nombrei : int 

Le premier nombre entier. 
nombre2 : int 

Le second nombre entier. 


Avec une description plus longue. 
Sur plusieurs lignes. 


Returns 


Le produit des deux nombres. 


mun 


return nombrei *nombre2 


if __name__ == "__main Ra 
print (f"2 x 3 = {Multiplie_nombres(2, 3)}") 


print (f"4 x 5 = {Multiplie_nombres (4, 5)}") 


Ce script est d’ailleurs parfaitement fonctionnel : 


$ python script _quality_ok.py 
2x3 = 6 
4 x 5 = 20 


On va tout d’abord vérifier la conformité avec la PEP 8 avec l’outil pycodestyle : 


$ pycodestyle script_quality_not_ok.py 

script _quality_not_ok.py:6:1: E302 expected 2 blank lines, found 1 
script _quality_not_ok.py:6:30: E231 missing whitespace after ',' 
script_quality_not_ok.py:6:38: E202 whitespace before ')' 
script_quality_not_ok.py:26:21: E225 missing whitespace around operator 


script_quality_not_ok.py:31:10: E211 whitespace before '(' 


Ligne 2. Le bloc script_quality_not_ok.py:6:1: désigne le nom du script (script_quality_not_ok.py), le nu- 
méro de la ligne (6) et le numéro de la colonne (1) où se trouve la non-conformité avec la PEP 8. Ensuite, pycodestyle 
fournit un code et un message explicatif. Ici, il faut deux lignes vides avant la fonction Multiplie_nombres(). 

Ligne 3. Il manque un espace après la virgule qui sépare les arguments nombre1 et nombre2 dans la définition de la 
fonction Multiplie_nombres() à la ligne 6 (colonne 30) du script. 


7. http: //pep8online.com/ 
8. https: //python.sdv.univ-paris-diderot .fr/data-files/script_quality_not_ok.py 
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Ligne 4. Il y un espace de trop après le second argument nombre2 dans la définition de la fonction Multiplie_nombres () 
à la ligne 6 (colonne 38) du script. 
Ligne 5. Il manque un espace après l’opérateur * à la ligne 26 (colonne 21) du script. 
Ligne 6. Il y a un espace de trop entre print et ( à la ligne 31 (colonne 10) du script. 
Remarquez que curieusement, pycodestyle n’a pas détecté que le nom de la fonction Multiplie_nombres() ne res- 
pecte pas la convention de nommage. 
Ensuite, l’outil pydocstyle va vérifier la conformité avec la PEP 257 et s’intéresser particulièrement aux docstrings : 
$ pydocstyle script_quality_not_ok.py 
script_quality_not_ok.py:1 at module level: 
D200: One-line docstring should fit on one line with quotes (found 2) 
script_quality_not_ok.py:7 in public function Multiplie_ nombres: 
D205: 1 blank line required between summary line and description (found 0) 


script_quality_not_ok.py:7 in public function Multiplie_ nombres: 
D400: First line should end with a period (not 's') 


Lignes 2 et 3. pydocstyle indique que la docstring à la ligne 1 du script est sur deux lignes alors qu’elle devrait être sur 
une seule ligne. 

Lignes 4 et 5. Dans la docstring de la fonction Multiplie_nombres () (ligne 7 du script), il manque une ligne vide entre 
la ligne résumé et la description plus complète. 

Lignes 6 et 7. Dans la docstring de la fonction Multiplie_nombres() (ligne 7 du script), il manque un point à la fin de 
la première ligne. 

Les outils pycodestyle et pydocstyle vont simplement vérifier la conformité aux PEP 8 et 257. L'outil pylint va lui 
aussi vérifier une partie de ces règles mais il va également essayer de comprendre le contexte du code et proposer des éléments 
d'amélioration. Par exemple : 

$ pylint script_quality_not_ok.py 


oR RRA Module script_quality_not_ok 
script_quality_not_ok.py:6:29: C0326: Exactly one space required after comma 


def Multiplie_nombres (nombrei ,nombre2 ): 
^ (bad-whitespace) 
script _quality_not_ok.py:6:38: C0326: No space allowed before bracket 


def Multiplie_nombres (nombrei ,nombre2 ): 


(bad-whitespace) 
script _ quality _not_ok.py:31:10: C0326: No space allowed before bracket 
print ((f"4 x 5 = {Multiplie_nombres(4, 5)}") 
^ (bad-whitespace) 
script_quality_not_ok.py:6:0: C0103: Function name "Multiplie_nombres" 
doesn't conform to snake_case naming style (invalid-name) 
script_quality_not_ok.py:4:0: W0611: Unused import os (unused-import) 


Your code has been rated at 0.00/10 


Lignes 3 à 5. pylint indique qu’il manque un espace entre les paramètres de la fonction Multiplie_nombres() (ligne 
6 et colonne 29 du script). La ligne du script qui pose problème est affichée, ce qui est pratique. 

Lignes 6 à 8. pylint identifie un espace de trop après le second paramètre de la fonction Multiplie_nombres(). 

Ligne 9 à 11. Il y a un espace de trop entre print et (. 

Lignes 12 et 13. Le nom de la fonction Multiplie_nombres() ne respecte pas la convention PEP 8. La fonction devrait 
s’appeler multiplie_nombres(). 

Ligne 14. Le module os est chargé mais pas utilisé (ligne 4 du script). 

Ligne 17. pylint produit également une note sur 10. Ne soyez pas surpris si cette note est très basse (voire négative) la 
première fois que vous analysez votre script avec pylint. Cet outil fournit de nombreuses suggestions d’amélioration et la 
note attribuée à votre script devrait rapidement augmenter. Pour autant, la note de 10 est parfois difficile à obtenir. Ne soyez 
pas trop exigeant. 

Une version améliorée du script précédent est disponible en ligne °. 


15.4 Organisation du code 
Il est fondamental de toujours structurer et organiser son code de la même manière. Ainsi, on sait tout de suite où trouver 


l'information et un autre programmeur pourra s’y retrouver. Voici un exemple de code avec les différents éléments dans le bon 
ordre : 


9. https://python.sdv.univ-paris-diderot.fr/data-files/script_quality_ok.py 
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"""Docstring d'une ligne décrivant brièvement ce que fait le programme. 


python nom_de_ce_super_script.py argumenti argument2 


argumenti: 
argument2: 


un entier signifiant un truc 


nan 


une chaîne de caractères décrivant un bidule 


__authors__ = ("Johny B Good", "Hubert de la Pate Feuilletée") 
__contact__ = ("johny@bgood.us", "hub@pate.feuilletee.fr") 
__copyright__ = "MIT" 

__date__ = "2030-01-01" 

__version__= "1.2.3" 


import module_interne 
import module_interne_2 


import module_externe 


UNE_CONSTANTE = valeur 
UNE_AUTRE_CONSTANTE = une_autre_valeur 


class UneSuperClasse(): 
"""Résumé de la docstring décrivant la classe. 


Description détaillée ligne 1 
Description détaillée ligne 2 


Description détaillée ligne 3 
nun 


def init__(self): 


"""Résumé de la docstring décrivant le constructeur. 


Description détaillée ligne 1 
Description détaillée ligne 2 
Description détaillée ligne 3 
nun 


Eisai] 


def une_méthode_simple (self): 


"""Docstring d'une ligne décrivant la méthode.""" 


Le 


def une_méthode_complexe(self, argl): 


"""Résumé de la docstring décrivant la méthode. 


Description détaillée ligne 1 
Description détaillée ligne 2 
Description détaillée ligne 3 
nun 

[...] 


return un_truc 


def une_fonction_complexe(argl, arg2, arg3): 
"""Résumé de la docstring décrivant la fonction. 


Description détaillée ligne 1 
Description détaillée ligne 2 
Description détaillée ligne 3 
nun 

[...] 


return une_chose 


def une_fonction_simple(argl, arg2): 
"""Docstring d'une ligne décrivant la fonction.""" 


Ex 


return autre _chose 


if __name__ == __main__": 
# ici débute le programme principal 
| 


Lignes 1 à 9. Cette docstring décrit globalement le script. Cette docstring (ainsi que les autres) seront visibles si on importe 
le script en tant que module, puis en invoquant la commande help() (voir chapitre 14 Création de modules). 


Lignes 11 à 15. On définit ici un certain nombres de variables avec des doubles underscores donnant quelques informations 
sur la version du script, les auteurs, etc. Il s’agit de métadonnées que la commande help() pourra afficher. Bien sûr, ces 
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métadonnées ne sont pas obligatoires, mais elles sont utiles lorsque le code est distribué à la communauté. 

Lignes 17 à 20. Importation des modules. D’abord les modules internes 4 Python (fournis en standard), puis les modules 
externes (ceux qu'il faut installer en plus), un module par ligne. 

Lignes 22 et 23. Définition des constantes. Le nom des constantes est en majuscule. 

Ligne 26. Définition d’une classe. On a laissé deux lignes vides avant. 

Lignes 27 à 32. Docstring décrivant la classe. 

Lignes 33, 42 et 46. Avant chaque méthode de la classe, on laisse une ligne vide. 

Lignes 58 à 72. Après les classes, on met les fonctions « classiques ». Avant chaque fonction, on laisse deux lignes vides. 

Lignes 75 à 77. On écrit le programme principal. Le test ligne 76 n’est vrai que si le script est utilisé en tant que programme. 
Les lignes suivantes ne sont donc pas exécutées si le script est chargé comme un module. 


15.5 


Conseils sur la conception d’un script 


Voici quelques conseils pour vous aider à concevoir un script Python. 


15.6 


Réfléchissez avec un papier, un crayon... et un cerveau (voire même plusieurs) ! Reformulez avec des mots en français 
(ou en anglais) les consignes qui vous ont été données ou le cahier des charges qui vous a été communiqué. Dessinez 
ou construisez des schémas si cela vous aide. 

Découpez en fonctions chaque élément de votre programme. Vous pourrez ainsi tester chaque élément indépendam- 
ment du reste. Pensez à écrire les docstrings en même temps que vous écrivez vos fonctions. 

Quand l'algorithme est complexe, commentez votre code pour expliquer votre raisonnement. Utiliser des fonctions (ou 
méthodes) encore plus petites peut aussi être une solution. 

Documentez-vous. L’algorithme dont vous avez besoin existe-t-il déjà dans un autre module ? Existe-t-il sous la forme 
de pseudo-code ? De quels outils mathématiques avez-vous besoin dans votre algorithme ? 

Si vous créez ou manipulez une entité cohérente avec des propriétés propres, essayez de construire une classe. Jetez, 
pour cela, un œil au chapitre 19 Avoir la classe avec les objets. 

Utilisez des noms de variables explicites, qui signifient quelque chose. En lisant votre code, on doit comprendre ce que 
vous faites. Choisir des noms de variables pertinents permet aussi de réduire les commentaires. 

Quand vous construisez une structure de données complexe (par exemple une liste de dictionnaires contenant d’autres 
objets), documentez et illustrez l’organisation de cette structure de données sur un exemple simple. 

Testez toujours votre code sur un jeu de données simple pour pouvoir comprendre rapidement ce qui se passe. Par 
exemple, une séquence de 1000 bases est plus facile à gérer que le génome humain ! Cela vous permettra également 
de retrouver plus facilement une erreur lorsque votre programme ne fait pas ce que vous souhaitez. 

Lorsque votre programme « plante », lisez le message d’erreur. Python tente de vous expliquer ce qui ne va pas. Le 
numéro de la ligne qui pose problème est aussi indiqué. 

Discutez avec des gens. Faites tester votre programme par d’autres. Les instructions d’utilisation sont-elles claires ? 
Si vous distribuez votre code : 

— Rédigez une documentation claire. 

— Testez votre programme (jetez un œil aux tests unitaires 

— Précisez une licence d'utilisation. Voir par exemple le site Choose an open source license ||. 


10), 


Pour terminer : la PEP 20 


La PEP 20 est une sorte de réflexion philosophique avec des phrases simples qui devraient guider tout programmeur. 
Comme les développeurs de Python ne manque pas d’humour, celle-ci est accessible sous la forme d’un « œuf de Pâques » 
(easter egg en anglais) ou encore « fonctionnalité cachée d’un programme » en important un module nommé this : 


>>> 
The 


import this 
Zen of Python, by Tim Peters 


Beautiful is better than ugly. 
Explicit is better than implicit. 
Simple is better than complex. 
Complex is better than complicated. 
Flat is better than nested. 

Sparse is better than dense. 
Readability counts. 


10. https://fr.wikipedia.org/wiki/Test_unitaire 
11. https://choosealicense.com/ 


128 


Cours de Python / Université de Paris / UFR Sciences du Vivant 


15.6. Pour terminer : la PEP 20 Chapitre 15. Bonnes pratiques en programmation Python 


Special cases aren't special enough to break the rules. 

Although practicality beats purity. 

Errors should never pass silently. 

Unless explicitly silenced. 

In the face of ambiguity, refuse the temptation to guess. 

There should be one-- and preferably only one --obvious way to do it. 
Although that way may not be obvious at first unless you're Dutch. 
Now is better than never. 

Although never is often better than *rightx* now. 

If the implementation is hard to explain, it's a bad idea. 

If the implementation is easy to explain, it may be a good idea. 
Namespaces are one honking great idea -- let's do more of those! 
>>> 


Et si l’aventure et les easter eggs vous plaisent, testez également la commande 


>>> import antigravity 


Il vous faudra un navigateur et une connexion internet. 


Pour aller plus loin 
— L'article Python Code Quality : Tools & Best Practices |? du site Real Python est une ressource intéressante pour 
explorer plus en détail la notion de qualité pour un code Python. De nombreux linters y sont présentés. 
— Les articles Assimilez les bonnes pratiques de la PEP 8'* du site OpenClassrooms et Structuring Python Programs 
du site Real Python rappellent les règles d’ écriture et les bonnes pratiques vues dans ce chapitre. 


14 


12. https: //realpython.com/python-code-quality/ 
13. https://openclassrooms.com/fr/courses/4425111-perfectionnez-vous-en-python/4464230-assimilez-les-bonnes-pratiques-de-la-pep-8 
14. https://realpython.com/python-program-structure/ 
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Chapitre 16 


Expressions régulières et parsing 


Le module re permet d’utiliser des expressions régulières avec Python. Les expressions régulières sont aussi appelées 
en anglais regular expressions ou en plus court regex. Dans la suite de ce chapitre, nous utiliserons souvent le mot regex 
pour désigner une expression régulière. Les expressions régulières sont puissantes et incontournables en bioinformatique, 
spécialement lorsque vous souhaitez récupérer des informations dans de gros fichiers. 

Cette action de recherche de données dans un fichier est appelée plus généralement parsing (qui signifie littéralement « 
analyse syntaxique »). Le parsing fait partie du travail quotidien du bioinformaticien, il est sans arrêt en train de « fouiller 
» dans des fichiers pour en extraire des informations d’intérêt comme par exemple récupérer les coordonnées 3D des atomes 
d’une protéine dans un fichier PDB ou encore extraire les gènes d’un fichier GenBank. 

Dans ce chapitre, nous ne ferons que quelques rappels sur les expressions régulières. Pour une documentation plus com- 
plète, référez-vous à la page d'aide des expressions régulières ! sur le site officiel de Python. 


16.1 Définition et syntaxe 


Une expression régulière est une suite de caractères qui a pour but de décrire un fragment de texte. Cette suite de caractères 
est encore appelée motif (en anglais pattern), motif qui est constitué de deux types de caractères : 

— Les caractères dits normaux. 

— Les métacaractères ayant une signification particulière, par exemple le caractère ~ signifie début de ligne et non pas le 

caractère « chapeau » littéral. 

Avant de présenter les regex en Python, nous allons faire un petit détour par Unix. En effet, certains programmes comme 
egrep, sed ou encore awk savent interpréter les expressions régulières. Tous ces programmes fonctionnent généralement 
selon le schéma suivant : 

— Le programme lit un fichier ligne par ligne. 

— Pour chaque ligne lue, si l’expression réguliére passée en argument est retrouvée dans la ligne, alors le programme 

effectue une action. 

Par exemple, pour le programme egrep : 

$ egrep ""DEF" herp_virus.gbk 
DEFINITION Human herpesvirus 2, complete genone. 

Ici, egrep affiche toutes les lignes du fichier du virus de l’herpès (herp_virus.gbk) dans lesquelles la regex “DEF 

(c’est-à-dire le mot DEF en début de ligne) est retrouvée. 


Remarque 

Il est intéressant de faire un point sur le vocabulaire utilisé en anglais et en français. En général, on utilise le verbe to 
match pour indiquer qu’une regex « a fonctionné ». Bien qu'il n’y ait pas de traduction littérale en français, on peut utiliser 
les verbes « retrouver » ou « correspondre ». Par exemple, on pourra traduire l’expression « The regex matches the line » par 
« La regex est retrouvée dans la ligne » ou encore « La regex correspond dans la ligne ». 


Après avoir introduit le vocabulaire des regex, voici quelques éléments de syntaxe des métacaractères : 


1. https://docs.python.org/fr/3/library/re.html 
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` Début de chaîne de caractères ou de ligne. 
Exemple : la regex “ATG est retrouvée dans la chaîne de caractères ATGCGT mais pas dans la chaîne CCATGTT. 
$ Fin de chaîne de caractères ou de ligne. 
Exemple : la regex ATG$ est retrouvée dans la chaîne de caractères TGCATG mais pas dans la chaîne CCATGTT. 
. N'importe quel caractère (mais un caractère quand même). 
Exemple : la regex A.G est retrouvée dans ATG, AtG, A4G, mais aussi dans A-G ou dans À G. 
[ABC] Le caractère A ou B ou C (un seul caractère). 
Exemple : la regex T [ABC] G est retrouvée dans TAG, TBG ou TCG, mais pas dans TG. 
[A-Z] N'importe quelle lettre majuscule. 
Exemple : la regex CLA-Z]T est retrouvée dans CAT, CBT, CCT... 
[a-z] N’importe quelle lettre minuscule. 
[0-9] N’importe quel chiffre. 
[A-Za-z0-9] N’importe quel caractère alphanumérique. 
["AB] N’importe quel caractère sauf A et B. 
Exemple : la regex CG[* AB] T est retrouvée dans CG9T, CGCT... mais pas dans CGAT ni dans CGBT. 
\ Caractére d’échappement (pour protéger certains caractéres). 
Exemple : la regex \+ désigne le caractére + littéral. La regex A\.G est retrouvée dans A.G et non pas dans A suivi de 
n'importe quel caractère, suivi de G. 
* 0 an fois le caractère précédent ou l’expression entre parenthèses précédente. 
Exemple : la regex A (CG) *T est retrouvée dans AT, ACGT, ACGCGT... 
+ làn fois le caractère précédent ou l’expression entre parenthèses précédente. 
Exemple : la regex A(CG)+T est retrouvée dans ACGT, ACGCGT... mais pas dans AT. 
? 041 fois le caractère précédent ou l’expression entre parenthèses précédente. 
Exemple : la regex A (CG) ?T est retrouvée dans AT ou ACGT. 
{n} n fois le caractère précédent ou l’expression entre parenthèses précédente. 
Exemple : la regex A(CG) {2}T est retrouvée dans ACGCGT mais pas dans ACGT, ACGCGCGT ou ACGCG. 
{n,m} nam fois le caractère précédent ou l’expression entre parenthèses précédente. 
Exemple : la regex ACC) {2, 4}T est retrouvée dans ACCT, ACCCT et ACCCCT mais pas dans ACT, ACCCCCT ou ACCC. 
{n,} Au moins n fois le caractère précédent ou I’ expression entre parenthèses précédente. 
Exemple : la regex ACC) {2, }T est retrouvée dans ACCT, ACCCT et ACCCCT mais pas à ACT ou ACCC. 
{,m} Au plus m fois le caractère précédent ou l’expression entre parenthèses précédente. 
Exemple : la regex A(C){,23T est retrouvée dans AT, ACT et ACCT mais pas dans ACCCT ou ACC. 
(CGITT) Les chaînes de caractères CG ou TT. 
Exemple : la regex A(CG|TT)C est retrouvée dans ACGC ou ATTC. 
Enfin, il existe des caractères spéciaux qui sont bien commodes et qui peuvent être utilisés en tant que métacaractères : 
\d remplace n’importe quel chiffre (d signifie digit), équivalent à [0-9]. 
\w remplace n’importe quel caractère alphanumérique et le caractère souligné (underscore) (w signifie word character), 
équivalent à [O-9A-Za-z_]. 
\s remplace n’importe quel « espace blanc » (whitespace) (s signifie space), équivalent à [ \t\n\r\f]. La notion 
d’espace blanc a été abordée dans le chapitre 10 Plus sur les chaînes de caractères. Les espaces blancs les plus 


classiques sont l’espace , la tabulation \t, le retour à la ligne \n, mais il en existe d’autres comme \r et \f que nous 
ne développerons pas ici. \s est trés pratique pour détecter une combinaison d’espace(s) et/ou de tabulation(s). 


Comme vous le constatez, les métacaractéres sont nombreux et leur signification est parfois difficile 4 maitriser. Faites 
particulièrement attention aux métacaractères ., + et * qui, combinés ensemble, peuvent donner des résultats ambigus. 

Il est important de savoir par ailleurs que les regex sont « avides » (greedy en anglais) lorsqu’on utilise les métacaractéres 
+ et *. C’est-à-dire que la regex cherchera à « s’étendre » au maximum. Par exemple, si on utilise la regex A+ pour faire une 
recherche dans la chaine TTTAAAAAAAAGC, tous les A de cette chaine (8 en tout) seront concernés, bien que AA, AAA, etc. « 
fonctionnent » également avec cette regex. 


Cours de Python / Université de Paris / UFR Sciences du Vivant 


131 


Chapitre 16. Expressions régulières et parsing 16.2. Quelques ressources en ligne 


16.2 Quelques ressources en ligne 


Nous vous conseillons de tester systématiquement vos expressions régulières sur des exemples simples. Pour vous aider, 
nous vous recommandons plusieurs sites internet : 

— RegexOne? : tutoriel en ligne très bien fait. 

— RegExr? et ExtendsClass * : visualisent tous les endroits où une regex est retrouvée dans un texte. 

— pythex.org> : interface simple et efficace, dédiée à Python. 

— Regular-Expressions.info * : documentation exhaustive sur les regex (il y a même une section sur Python). 

N'hésitez pas à explorer ces sites avant de vous lancer dans les exercices ou dans l’écriture de vos propres regex! 


16.3 Le module re 


16.3.1 La fonction search() 


Dans le module re, la fonction search() est incontournable. Elle permet de rechercher un motif, c’est-à-dire une regex, au 
sein d’une chaîne de caractères avec une syntaxe de la forme search(motif, chaine). Si motif est retrouvé dans chaine, 
Python renvoie un objet du type SRE_Match. 

Sans entrer dans les détails propres au langage orienté objet, si on utilise un objet du type SRE_Match dans un test, il 
sera considéré comme vrai. Regardez cet exemple dans lequel on va rechercher le motif tigre dans la chaîne de caractères 
"girafe tigre singe": 


>>> import re 
>>> animaux = "girafe tigre singe" 
>>> re.search("tigre", animaux) 
<_sre.SRE_ Match object at Ox7fefdaefe2a0> 
>>> if re.search("tigre", animaux): 

print ("OK") 


OK 


Attention 
Le motif que vous utilisez comme premier argument de la fonction search() sera interprété en tant que regex. Ainsi, 
“DEF correspondra au mot DEF en début de chaîne et pas au caractère littéral suivi du mot DEF. 


16.3.2 Les fonctions match() et fullmatch() 


Il existe aussi la fonction match() dans le module re qui fonctionne sur le modèle de search (). La différence est qu’elle 
renvoie un objet du type SRE_Match seulement lorsque la regex correspond au début de la chaîne de caractères (à partir du 
premier caractère). 


>>> animaux = "girafe tigre singe" 

>>> re.search("tigre", animaux) 

<_sre.SRE_Match object at Ox7fefdaefe718> 

>>> re.match("tigre", animaux) 

>>> 

>>> animaux = "tigre singe" 

>>> re.match("tigre", animaux) 

<_sre.SRE_Match object; span=(0, 5), match='tigre'> 
>>> 


Il existe également la fonction fullmatch() qui renvoie un objet du type SRE_Match si et seulement si l’expression 
régulière correspond exactement à la chaîne de caractères. 


>>> animaux = "tigre " 
>>> re.fullmatch("tigre", animaux) 
>>> animaux = "tigre" 
>>> re.fullmatch("tigre", animaux) 


<_sre.SRE_Match object; span=(0, 5), match='tigre'> 


2. https://regexone.com/ 

3. https://regexr.com/ 

4. https: //extendsclass.com/regex-tester.html#python 
5. https://pythex.org/ 

6. https: //www.regular-expressions.info 
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De manière générale, nous vous recommandons l’usage de la fonction search(). Si vous souhaitez avoir une correspon- 
dance avec le début de la chaîne de caractères comme dans la fonction match(), vous pouvez toujours utiliser l’accroche de 
début de ligne ^. Si vous voulez une correspondance exacte comme dans la fonction fullmatch(), vous pouvez utiliser les 
métacaractères ^ et $, par exemple “tigre$. 


16.3.3 Compilation d’expressions régulières 
Lorsqu'on a besoin de tester la même expression régulière sur plusieurs milliers de chaînes de caractères, il est pratique 
de compiler préalablement la regex à l’aide de la fonction compile() qui renvoie un objet de type SRE_Pattern : 
>>> regex = re.compile(""tigre") 


>>> regex 
<_sre.SRE_Pattern object at Ox7fefdafd0df0> 


On peut alors utiliser directement cet objet avec la méthode .search() : 


>>> animaux = "girafe tigre singe" 
>>> regex.search (animaux) 
>>> animaux = "tigre singe" 


>>> regex.search (animaux) 

<_sre.SRE_Match object at Ox7fefdaefe718> 
>>> animaux = "singe tigre" 

>>> regex.search (animaux) 


16.3.4 Groupes 


L'intérêt de l’objet de type SRE_Match renvoyé par Python lorsqu’une regex trouve une correspondance dans une chaîne 
de caractéres est de pouvoir ensuite récupérer certaines zones précises : 


>>> regex = re.compile("([0-9]+)\.([0-9]+)") 


Dans cet exemple, on recherche un nombre décimal, c’est-à-dire une chaîne de caractères : 
— qui débute par un ou plusieurs chiffres [0-9]+, 
— suivi d'un point \. (le point a d’habitude une signification de métacaractére, donc il faut l’échapper avec \ pour qu'il 
retrouve sa signification de point), 
— et qui se termine encore par un ou plusieurs chiffres [0-9] +. 
Les parenthèses dans la regex créent des groupes ( [0-9] + deux fois) qui seront récupérés ultérieurement par la méthode 
.group(). 
>>> resultat = regex.search("pi vaut 3.14") 


>>> resultat.group (0) 
"3.14" 

>>> resultat.group(1) 
13! 

>>> resultat. group (2) 
tigt 

>>> resultat.start() 
8 


>>> resultat.end() 
12 


La totalité de la correspondance est donnée par . group (0), le premier élément entre parenthèses est donné par . group (1) 
et le second par .group(2). 

Les méthodes .start() et .end() donnent respectivement la position de début et de fin de la zone qui correspond à la 
regex. Notez que la méthode .search() ne renvoie que la première zone qui correspond à l’expression régulière, même s’il 
en existe plusieurs : 


>>> resultat = regex.search("pi vaut 3.14 et e vaut 2.72") 
>>> resultat.group (0) 
"3.14" 


16.3.5 La méthode .findall() 


Pour récupérer chaque zone, s’il y en a plusieurs, vous pouvez utiliser la méthode .findal1() qui renvoie une liste des 
éléments en correspondance. 
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>>> regex = re.compile("[0-9]+\.[0-9]+") 


>>> resultat = regex.findall("pi vaut 3.14 et e vaut 2.72") 
>>> resultat 
['3.14', '2.72'] 


L'utilisation des groupes entre parenthèses est également possible et ceux-ci sont alors renvoyés sous la forme de tuples. 


>>> regex = re.compile("([0-9]+)\.([0-9]+)") 


>>> resultat = regex.findall("pi vaut 3.14 et e vaut 2.72") 
>>> resultat 
[('3', '14'), ('2', '72')] 


16.3.6 La méthode .sub() 


Enfin, la méthode . sub() permet d’effectuer des remplacements assez puissants. Par défaut la méthode .sub(chaine1, 
chaine2) remplace toutes les occurrences trouvées par l’expression régulière dans chaine2 par chainel. Si vous souhaitez 
ne remplacer que les n premières occurrences, utilisez l’argument count=n : 


>>> regex = re.compile("[0-9]+\.[0-9]+") 


>>> regex.sub("quelque chose", "pi vaut 3.14 et e vaut 2.72") 
"pi vaut quelque chose et e vaut quelque chose" 
>>> regex.sub("quelque chose", "pi vaut 3.14 et e vaut 2.72", count=1) 


"pi vaut quelque chose et e vaut 2.72' 


Encore plus puissant, il est possible d’ utiliser dans le remplacement des groupes qui ont été « capturés » avec des paren- 
théses. 


>>> regex = re.compile("([0-9]+)\.([0- 91+)") 

>>> phrase = "pi vaut 3.14 et e vaut 2.72 

>>> regex.sub("approximativement \\1i", phrase) 

"pi vaut approximativement 3 et e vaut vaut approximativement 2' 

>>> regex.sub("approximativement \\1 (puis .\\2)", phrase) 

‘pi vaut approximativement 3 (puis .14) et e vaut approximativement 2 (puis .72)' 


Si vous avez capturé des groupes, il suffit d’utiliser \\1, \\2 (etc.) pour utiliser les groupes correspondants dans la chaine 
de caractéres substituée. On notera que la syntaxe générale pour récupérer des groupes dans les outils qui gérent les regex est 
\1, \2, etc. Toutefois, Python nous oblige 4 mettre un deuxiéme backslash car il y a ici deux niveaux : un premier niveau 
Python où on veut mettre un backslash littéral (donc \\), puis un second niveau regex dans lequel on veut retrouver \1. Si cela 
est confus, retenez seulement qu’il faut mettre un \\ devant le numéro de groupe. 

Enfin, sachez que la réutilisation d’un groupe précédemment capturé est aussi utilisable lors d’une utilisation classique de 
regex. Par exemple : 


>>> re.search("(pan)\\1i", "bambi et panpan") 
<_sre.SRE_Match object; span=(9, 15), match='panpan'> 
>>> re.search("(pan)\\1i", "le pistolet a fait pan !") 
>>> 


Dans la regex (pan) \\1, on capture d’abord le groupe (pan) grâce aux parenthèses (il s’agit du groupe 1 puisque c’est le 
premier jeu de parenthéses), immédiatement suivi du méme groupe grace au \\1. Dans cet exemple, on capture donc le mot 
panpan (lignes | et 2). Si, par contre, on a une seule occurrence du mot pan, cette regex ne fonctionne pas, ce qui est le cas 
ligne 3. 

Bien sûr, si on avait eu un deuxième groupe, on aurait pu le réutiliser avec \\2, un troisième groupe avec \\3, etc. 

Nous espérons vous avoir convaincu de la puissance du module re et des expressions réguliéres. Alors, plus de temps a 
perdre, à vos regex! 


16.4 Exercices 


Conseil : pour ces exercices, créez des scripts puis exécutez-les dans un shell. 


16.4.1 Regex de base 


Dans cet exercice, nous allons manipuler le fichier GenBank NC_001133.gbk ” correspondant au chromosome I de la 
levure Saccharomyces cerevisiae. 
Créez un script regex_genbank. py : 


7. https://python.sdv.univ-paris-diderot.fr/data-files/NC_001133.gbk 
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— qui recherche le mot DEFINITION en début de ligne dans le fichier GenBank, puis affiche la ligne correspondante ; 

— qui recherche tous les journaux (mot-clé JOURNAL) dans lesquels ont été publiés les travaux sur cette séquence, puis 
affiche les lignes correspondantes. 

Conseils : 

— Vous utiliserez des regex pour trouver les lignes demandées. 

— Vous trouverez des explications sur le format GenBank et des exemples de code dans l’annexe A Quelques formats de 
données rencontrés en biologie. 


16.4.2 Enzyme de restriction 


Une enzyme de restriction est une protéine capable de couper une molécule d’ADN. Cette coupure se fait sur le site de 
restriction de l’ ADN qui correspond à une séquence particulière de nucléotides (bases). 

Pour chacune des enzymes ci-dessous, déterminez les expressions régulières qui décrivent leurs sites de restriction. Le 
symbole N correspond aux bases A, T, C ou G. W correspond à A ou T . Y correspond à C ou T. R correspond à A ou G. 


Enzyme Site de restriction 


HinFI GANTC 

EcoRII CCWGG 

BbvBI GGYRCC 

Bcol CYCGRG 
PspSII RGGWCCY 
BbvAI GAANNNNTTC 


16.4.3 Nettoyeur d’espaces 


Le fichier cigale_fourmi.txt * contient le célèbre poème de Jean de la Fontaine. Malheureusement, la personne qui l’a 
recopié a parfois mis plusieurs espaces au lieu d’un seul entre les mots. 

Créez un script cigale_fourmi.py qui grâce à une regex et à la fonction sub() remplace plusieurs espaces par un seul 
espace dans le texte ci-dessus. Le nouveau texte « propre » sera enregistré dans un fichier cigale_fourmi_propre.txt. 


16.4.4 Liste des protéines humaines 


Téléchargez le fichier human-proteome.fasta? qui contient le protéome humain, c’est-à-dire les séquences de len- 
semble des protéines chez 1? Homme. Ce fichier est au format FASTA. 

On souhaite lister toutes ces protéines et les indexer avec un numéro croissant. 

Créez un script liste_proteome.py qui: 

— lit le fichier human-proteome.fasta; 

— extrait, avec une regex, de toutes les lignes de commentaires des séquences, le numéro d’accession de la protéine ; 

— affiche le mot protein, suivi d’un numéro qui s’incrémente, suivi du numéro d’accession. 

Voici un exemple de sortie attendue : 


protein 00001 095139 
protein 00002 075438 
protein 00003 Q8N4C6 


Leia 

protein 20371 Q8IZJ1 
protein 20372 Q9UKP6 
protein 20373 Q96HZ7 


Conseils : 

— Vous trouverez des explications sur le format FASTA et des exemples de code dans l'annexe A Quelques formats de 
données rencontrés en biologie. 

— La ligne de commentaire d'une séquence au format FASTA est de la forme 
>sp|095139|NDUB6_HUMAN NADH dehydrogenase [...] 
Elle débute toujours pas le caractére >. Le numéro d’accession 095139 se situe entre le premier et le second symbole 
| (symbole pipe). Attention, il faudra « échapper » ce symbole car il a une signification particuliére dans une regex. 


8. https: //python.sdv.univ-paris-diderot.fr/data-files/cigale_fourmi.txt 
9. https://python.sdv.univ-paris-diderot.fr/data-files/human-proteome.fasta 
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— Le numéro qui s’incrémente débutera à 1 et sera affiché sur 5 caractères avec des 0 à sa gauche si nécessaires (formatage 
{:05d}). 


16.4.5 Le défi du dé-htmliseur (exercice +++) 


Le format HTML permet d’afficher des pages web dans un navigateur. Il s’agit d’un langage à balise qui fonctionne avec 
des balises ouvrantes <balise> et des balises fermantes </balise>. 

Créez un script dehtmliseur.py qui lit le fichier fichier_a_dehtmliser.html !° au format HTML et qui renvoie à 
l’écran tout le texte de ce fichier sans les balises HTML. 

Nous vous conseillons tout d’abord d’ouvrir le fichier HTML dans un éditeur de texte et de bien l’observer. N'hésitez pas 
à vous aider des sites mentionnés dans les ressources en ligne 


16.4.6 Nettoyeur de doublons (exercice +++) 


Téléchargez le fichier breves_doublons.txt !! qui contient des mots répétés deux fois. Par exemple : 


Le cinéma est devenu parlant, la radio radio finira en images. 
La sardine, c'est un petit petit poisson sans tête qui vit dans l'huile. 


betad 


Écrivez un script ote_doublons . py qui lit le fichier breves_doublons . txt et qui supprime tous les doublons à l’aide 
d’une regex. Le script affichera le nouveau texte à l’écran. 
Conseil : utilisez la méthode .sub(). 


10. https://python.sdv.univ-paris-diderot.fr/data-files/fichier_a_dehtmliser.html 
11. https://python.sdv.univ-paris-diderot.fr/data-files/breves_doublons.txt 
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Quelques modules d’intérêt en bioinformatique 


Nous allons aborder dans ce chapitre quelques modules très importants en bioinformatique. Le premier NumPy permet 
notamment de manipuler des vecteurs et des matrices. Le module Biopython permet de travailler sur des données biologiques, 
comme des séquences (nucléiques et protéiques) ou des structures (fichiers PDB). Le module matplotlib permet de créer 
des graphiques depuis Python. Enfin, le module pandas est très performant pour l’analyse de données, et scipy étend les 
possibilités offertes par NumPy, notamment en proposant des algorithmes couramment utilisés en calcul scientifique. 

Ces modules ne sont pas fournis avec la distribution Python de base (contrairement à tous les autres modules vus précé- 
demment). Avec la distribution Miniconda que nous vous avons conseillé d’utiliser (consultez pour cela la documentation en 
ligne '), vous pouvez rapidement les installer avec la commande : 


$ conda install -y numpy pandas matplotlib scipy biopython 


Dans ce chapitre, nous vous montrerons quelques exemples d’utilisation de ces modules pour vous convaincre de leur 
pertinence. 


17.1 Module NumPy 


Le module NumPy? est incontournable en bioinformatique. Il permet d’effectuer des calculs sur des vecteurs ou des 
matrices, élément par élément, via un nouveau type d’ objet appelé array. 
On charge le module NumPy avec la commande : 


>>> import numpy 


On peut également définir un nom raccourci pour NumPy : 


>>> import numpy as np 


17.1.1 Objets de type array 


Les objets de type array correspondent a des tableaux a une ou plusieurs dimensions et permettent d’effectuer du calcul 
vectoriel. La fonction array () convertit un objet séquentiel (comme une liste ou un tuple) en un objet de type array. Voici 
un exemple simple de conversion d’une liste 4 une dimension en objet array : 


>>> import numpy as np 
>>> a = [1, 2, 3] 

>>> np.array (a) 
array([1, 2, 3]) 

>>> b = np.array(a) 
>>> b 


array([1, 2, 3]) 
>>> type (b) 
<type 'numpy.ndarray'> 


Nous avons converti la liste [1, 2, 3] en array. Nous aurions obtenu le méme résultat si nous avions converti le tuple 
(1, 2, 3) enarray. 


1. https://python.sdv.univ-paris-diderot.fr/livre-dunod 
2. http: //numpy.scipy.org/ 
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Par ailleurs, lorsqu’on demande à Python d’afficher le contenu d’un objet array, le mot array et les symboles ([ et ]) 
sont utilisés pour le distinguer d’une liste (délimitée par les caractères [ et ]) ou d’un tuple (délimité par les caractères ( et )). 


Remarque 
Un objet array ne contient que des données homogènes, c’est-à-dire d’un type identique. 
Il est possible de créer un objet array à partir d’une liste contenant des entiers et des chaînes de caractères, mais dans ce 
cas, toutes les valeurs seront comprises par NumPy comme des chaînes de caractères : 


>>> a = np.array([1, 2, "tigre"]) 

>>> a 

array(['1', '2', 'tigre'], dtype='<U21') 
>>> type(a) 

<class 'numpy.ndarray'> 


De même, il est possible de créer un objet array à partir d’une liste constituée d’entiers et de floats, mais toutes les valeurs 
seront alors comprises par NumPy comme des floats : 


>>> b = np.array([1, 2, 3.5]) 
>>> b 

array([1. , 2. , 3.5]) 

>>> type(b) 

<class 'numpy.ndarray'> 


Ici, la notation 1. indique qu'il s’agit du float 1.0000... et pas de l’entier 1. 


Sur un modèle similaire à la fonction range (), la fonction arange () permet de construire un array à une dimension de 
manière simple. 


>>> np.arange (10) 
array ([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 


Comme avec range (), on peut spécifier en argument une borne de début, une borne de fin et un pas : 


>>> np.arange(10, 0, -1) 
array ([10, 9, 8, 7, 6, 5, 4, 3, 2, 1]) 


Un autre avantage de la fonction arange() est qu’elle génére des objets array qui contiennent des entiers ou des floats 
selon l’argument qu’on lui passe : 
>>> np.arange (10) 
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 91) 


>>> np.arange (10.0) 
array([ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9.]) 


La différence fondamentale entre un objet array à une dimension et une liste (ou un tuple) est que celui-ci est considéré 
comme un vecteur. Par conséquent, on peut effectuer des opérations élément par élément sur ce type d’objet, ce qui est bien 
commode lorsqu’on analyse de grandes quantités de données. Regardez ces exemples : 


>>> v = np.arange (4) 
>>> v 
array([0, 1, 2, 3]) 


> 
>>> v + 1 


array ([1, 2, 3, 4]) 
>>> v + 0.1 


array([ 0.1, Pet. “Qty HTA 
>>> v * 2 


array([0, 2, 4, 6]) 
>>> v * v 


array ([0, 1, 4, 9]) 


Avec les listes, ces opérations n’ auraient été possibles qu’en utilisant des boucles. Nous vous encourageons donc à utiliser 
dorénavant les objets array lorsque vous aurez besoin de faire des opérations élément par élément. 

Notez également que, dans le dernier exemple de multiplication (ligne 10), Parray final correspond à la multiplication 
élément par élément des deux arrays initiaux. 


17.12 Array et dimensions 


Il est aussi possible de construire des objets arrays à deux dimensions, il suffit de passer en argument une liste de listes à 
la fonction array () : 
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1ère colonne, indice O 


2ème colonne, indice 1 


o jo ind 
igne, indice 
A EU bien 
igne, Indice 
US], 1411 = g 
T5, [ell] 3* ligne, indice 2 


array | 


FIGURE 17.1 — Définition des lignes et colonnes dans un array 2D. 


>>> w = np.array([[1, 2], [3, 4], [5, 6]]) 


>>> W 

array ([[1, 2], 
[3, 4], 
[5, 6]]) 


On peut aussi créer des tableaux à trois dimensions en passant comme argument à la fonction array () une liste de listes 
de listes : 


>>> x = np.array([[[1, 2], [2, 3]], [[4, 5], [5, 6111) 


>>> x 

array ([[[1, 2], 
[2, 3]], 
[[4, 5], 
[5, 6]]]) 


La fonction array () peut créer des tableaux à n’importe quel nombre de dimensions. Toutefois ça devient vite compliqué 
lorsqu’on dépasse trois dimensions. Retenez qu’un objet array à une dimension peut être considéré comme un vecteur et un 
array à deux dimensions comme une matrice. Nous nous focaliserons dans la suite sur des arrays 1D ou 2D. 

Avant de continuer, il est important de définir comment sont organisés ces arrays 2D qui représentent des matrices. Il 
s’agit de tableaux de nombres qui sont organisés en lignes et en colonnes comme le montre la figure 17.1. Les indices indiqués 
dans cette figure seront définis un peu plus loin dans la rubrique Indices. 

Voici quelques attributs intéressants pour décrire un objet array : 

— .ndim renvoie le nombre de dimensions (par exemple, | pour un vecteur et 2 pour une matrice). 

— .shape renvoie les dimensions sous forme d’un tuple. Dans le cas d’une matrice (array à deux dimensions), la pre- 

mière valeur du tuple correspond au nombre de lignes et la seconde au nombre de colonnes. 

— .size renvoie le nombre total d'éléments contenus dans l’array. 


>>> v = np.arange (4) 
>>> v 

array ([0, 1, 2, 3]) 
>>> v.ndim 

1 

>>> v.shape 

(4,) 


>>> v.size 


4 

>>> w = np.array([[1, 2], [3, 4], [5, 6]]) 

>>> W 

array([[1, 2], 
[3, 4], 
[5, 6]]) 

>>> w.ndim 

2 

>>> w.shape 

(3, 2) 

>>> w.size 

6 


Et la méthode .reshape() renvoie un nouvel array avec les dimensions spécifiées : 
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>>> a = np.arange(0, 6) 
>>> a 

array([0, 1, 2, 3, 4, 5]) 
>>> a.shape 


(6,) 
>>> b = a.reshape((2, 3)) 
>>> b 
array ([[0, 1, 2], 
[3, 4, 511) 
>>> b.shape 
(2, 3) 
>>> a 


array ([0, 1, 2, 3, 4, 5]) 


Notez bien que le array a n’a pas été modifié et que a.reshape((2, 3)) n’est pas la même chose que a. reshape ( (3, 


2)) : 
>>> c = a.reshape((3, 2)) 
>>> c 
array ([[0, 1], 
[2, 3], 
[4, 5]]) 
>>> c.shape 
(3, 2) 


La méthode .reshape() attend que les nouvelles dimensions soient compatibles avec la dimension initiale de l’objet 
array, c’est-à-dire que le nombre d’ éléments contenus dans les différents arrays soit le même. Dans nos exemples précédents, 


6=2x3=3x2. 


Si les nouvelles dimensions ne sont pas compatibles avec les dimensions initiales, la méthode .reshape() génère une 


erreur. 
>>> a = np.arange(0, 6) 
>>> a 
array([0, 1, 2, 3, 4, 5]) 
>>> a.shape 
(6,) 
>>> d = a.reshape((3, 4)) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


ValueError: cannot reshape array of size 6 into shape (3,4) 


La méthode .resize() par contre ne déclenche pas d’erreur dans une telle situation et ajoute des O jusqu’à ce que le 


nouvel array soit rempli, ou bien coupe la liste initiale. 


>>> a = np.arange(0, 6) 
>>> a.shape 
(6,) 


>>> a.resize((3, 3), refcheck=False) 
>>> a.shape 


(3, 3) 

>>> a 

array ([[0, 1, 2], 
[3, 4, 5], 
[o, 0, 0]]) 


>>> b = np.arange(0, 10) 

>>> b.shape 

(10 ,) 

>>> b.resize((2, 3), refcheck=False) 
>>> b.shape 


(2, 3) 
>>> b 
array ([[0, 1, 2], 
[3, 4, 5]]) 
Attention 


Attention, cette modification de la forme de l’array par la méthode .resize() est faite « sur place » (in place), c’est-à-dire 
que la méthode ne renvoie rien mais l’array est bel et bien modifié (à l’image des méthodes sur les listes comme .reverse(), 
cf. chapitre 11 Plus sur les listes). Si option refcheck=False n’est pas présente, Python peut parfois renvoyer une erreur 


s’il existe des références vers l’array qu’on souhaite modifier. 


Il existe aussi la fonction np. resize () qui, dans le cas d’un nouvel array plus grand que |’ array initial, va répéter l’array 


initial afin de remplir les cases manquantes : 
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Remarque 


>>> a = np.arange (0, 6) 

>>> a.shape 

(6,) 

>>> c = np.resize(a, (3, 5)) 
>>> c.shape 

(3, 5) 

>>> c 


array ([[O, 1, 2, 3, 4], 
[5, 0, 1, 2, 3], 

>>> a SS 

array([0, 1, 2, 3, 4, 5]) 


Notez que cette fonction np.resize() renvoie un nouvel array mais ne modifie pas l’array initial contrairement à la 


méthode .resize() décrite ci-dessus. 


Depuis le début de ce chapitre, nous avons toujours montré l’affichage d’un array dans l’interpréteur : 


>>> a = np.array(range(10)) 

>>> a 

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 
>>> a2 = np.ones((3, 3)) 


>>> a2 

array([[1., 1., 1.], 
Hunt Dells 
Ets. dey. 4:11) 


Nous avons déjà indiqué que Python affiche systématiquement le mot array ainsi que les parenthèses, crochets et virgules 


pour séparer les éléments. Attention toutefois si vous utilisez la fonction print () car l’affichage est différent. Le mot array, 
les parenthèses et les virgules disparaissent : 


>>> print(a) 
[0 12345678 9] 
>>> print (a2) 


[[1. 1. 1.] 
[1. 1. 1.1 
Cis de 4:11 


Ceci peut amener des confusions spécialement pour un array 1D [0 1 2 3 4 5 6 7 8 9] et une liste contenant les 


même éléments [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]. Dans ce cas, seule la présence ou l’absence de virgules permet de 
trancher s’il s’agit d’un array ou d’une liste. 


17.1.3 Méthodes de calcul sur les arrays et argument axis 


Chaque array NumPy qui est créé possède une multitude de méthodes. Nombre d’entre elles permettent de faire des 
calculs de base comme .mean() pour la moyenne, .sum() pour la somme, .std() pour l’écart-type, .max () pour extraire le 
maximum, .min() pour extraire le minimum, etc. La liste exhaustive est ici 3, Par défaut, chacune de ces méthodes effectuera 
l’opération sur l’array entier, quelle que soit sa dimensionnalité. Par exemple : 


>>> import random as rd 

>>> 1 = list(range(8)) 

>>> rd.shuffle(1) 

>>> 1 

[2, 7, 6, 4, 0, 3, 1, 5] 

>>> a = np.resize(l, (4, 2)) 


>>> a 

array ([[2, 7], 
[6, 4], 
[o, 3], 
[1, 5]]) 

>>> a.max() 

7 


La méthode .max() nous a bien renvoyé la valeur maximale 7. Un argument très utile existant dans toutes ces méthodes 
est axis. Pour un array 2D, axis=0 signifie qu’on fera l’ opération le long de l’axe 0, à savoir les lignes. C’est-à-dire que 
l opération se fait en faisant varier les lignes. On récupère ainsi une valeur par colonne : 


3. https://numpy.org/doc/stable/reference/arrays.ndarray.html#calculation 
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>>> a.max(axis=0) 
array([6, 7]) 
Dans l’array 1D récupéré, le premier élément vaut 6 (maximum de la 1ère colonne) et le second vaut 7 (maximum de la 
seconde colonne). 
Avec axis=1 on fait une opération similaire mais en faisant varier les colonnes. On récupère ainsi une valeur par ligne : 


>>> a.max(axis=1) 
array([7, 6, 3, 5]) 


L’'array 1D récupéré a 4 éléments correspondant au maximum de chaque ligne. 
On comprend la puissance de cet argument axis. À nouveau, il est possible, en une ligne, de faire des calculs qui pourraient 
être très fastidieux avec les listes traditionnelles. 


17.1.4 Indices 


Pour récupérer un ou plusieurs élément(s) d’un objet array, vous pouvez utiliser les indices ou les tranches, de la même 
manière qu’avec les listes : 


>>> a = np.arange (10) 

>>> a 

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 
>>> al5:] 


array([5, 6, 7, 8, 91) 
>>> al::2] 

array([0, 2, 4, 6, 8]) 
>>> ali] 

1 


Dans le cas d’un objet array à deux dimensions, vous pouvez récupérer une ligne complète (d’indice i), une colonne 
complète (d’indice j) ou bien un seul élément. La figure 17.1 montre comment sont organisés les lignes / colonnes et indices. 


>>> a = np.array([[1, 2], [3, 4]]) 
>>> a 


array([[1, 2], 
[3, 4]]) 
>>> al: ,0] 
array([1, 3]) 
>>> a[0,:] 
array([1, 2]) 
>>> a[i, 1] 
4 


Lignes 5 à 8. La syntaxe a[i,:] renvoie la ligne d’indice i, et a[: , j] renvoie la colonne d'indice j. Les tranches sont 
évidemment aussi utilisables sur un array à deux dimensions. 

Lignes 9 à 10. La syntaxe ali, j] renvoie l’élément à la ligne d'indice i et à la colonne d'indice j. Notez que NumPy 
suit la convention mathématiques des matrices *, à savoir, on définit toujours un élément par sa ligne puis par sa colonne. 
En mathématiques, l’élément a;; d’une matrice A se trouve à la if ligne et à la j° colonne. 


Remarque 
— Pour un array 2D, si un seul indice est donné, par exemple a[i], on récupère la ligne d'indice i sous forme d’array 

1D: 

>>> a 

array([[1, 2], 

[3, 411) 

>>> alo] 

array([1, 2]) 

>>> ali] 


array([3, 4]) 


— Pour cette raison, la syntaxe a [i] [j] est également valide pour récupérer un élément : 


>>> a 

array([[1, 2], 
[3, 4]]) 

>>> ali, 1] 

4 


>>> ali] [1] 
4 


4. https://fr.wikipedia.org/wiki/Matrice_(math/C3/A9matiques)+tD/C3/A9finitions 
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Bien que cela soit possible, nous vous recommandons tout de même la syntaxe a[i, j] qui est plus proche de la définition 
mathématiques d’un élément de matrice >. 


17.1.5 Copie d’arrays 


Comme pour les listes, nous attirons votre attention sur la copie d’arrays : 
>>> a = np.arange(5) 
>>> a 


array([0, 1, 2, 3, 4]) 
>>> b = a 


>>> b[2] = -300 
>>> b 


array ([ 0, 1, -300, 3; 4]) 
>>> a 


array ([ 0, 1, -300, 3, 4]) 


Attention 
Par défaut la copie d’arrays se fait par référence comme pour tous les objets séquentiels en Python (listes, tuples, diction- 
naires, etc.). 


Afin d’éviter le probléme, vous pouvez soit utiliser la fonction np.array() qui crée une nouvelle copie distincte de 
l’array initial, soit la fonction copy.deepcopy() comme pour les listes (cf. chapitre 11 Plus sur les listes) : 


>>> a = np.full((2, 2), 0) 


>>> a 
array ([[O, 0], 
[o, 011) 
>>> b = np.array(a) 
>>> b[i, 1] = -300 
>>> c = copy.deepcopy (a) 
>>> c[1, 1] = -500 
>>> a 
array ([[0, 0], 
[o, 0]]) 
>>> b 
array ([[ 0, ol, 
[ 0, -300]]) 
>>> c 
array (CL 0, ol, 
[ 0, -500]]) 
Remarque 


On pourra noter que la stratégie b = np.array(a) fait bien une copie distincte de l’array a quelle que soit sa dimen- 
sionnalité. Ceci n’était pas le cas avec la fonction list () pour les copies de listes à partir de la dimensionnalité 2 : 


(to, 0], (1, 1]] 

>>> liste_2 list (liste_1) 

>>> liste_3 copy .deepcopy (liste_1) 
>>> liste_1[1][1] = -365 

>>> liste_2 

(fo, 0], [1, -365]] 

>>> liste_3 


(fo, 0], [1, 1]] 


>>> liste_1 


17.1.6 Construction automatique de matrices 


Il peut être parfois pénible de construire une matrice (array à deux dimensions) à l’aide d’une liste de listes. Le module 
NumPy possède quelques fonctions pratiques pour initialiser des matrices. Par exemple, Les fonctions zeros() et ones () 
construisent des objets array contenant des O ou des 1. Il suffit de leur passer en argument un tuple indiquant les dimensions 
voulues. 


5. https://fr.wikipedia.org/wiki/Matrice_(math/C3/A9matiques) #D/,C3/A9finitions 
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>>> np.zeros((2, 3)) 
array ([[0., 0., 0. 
[0., 0., O. 
>>> np.ones((3, 3 
array ([[1., 1., 1 
us Les A 
[1., 1., 1. 


Par défaut, les fonctions zeros () et ones () génèrent des floats, mais vous pouvez demander des entiers en passant le 
type (par exemple int, float, etc.) en second argument : 


>>> np.zeros((2,3), int) 
array ([[0, 0, 0], 
[0, 0, 0]]) 
Enfin, si vous voulez construire une matrice avec autre chose que des 0 ou des 1, vous avez à votre disposition la fonction 
full(): 


>>> np.full((2, 3), 7, int) 
array ([[7, 7, 7], 


CT: 7, 71]) 
>>> np.full((2, 3), 7, float) 
array([[ 7., 7., 7.1, 

C Ta, Cag. edd) 


Nous construisons ainsi une matrice constituée de 2 lignes et 3 colonnes. Celle-ci ne contient que le chiffre 7 sous formes 
d’entiers (int) dans le premier cas et de floats dans le second. 

Le module numpy contient aussi des fonctions pour lire des données 4 partir de fichiers et créer des arrays automatique- 
ment. Cela se révèle bien pratique car la plupart du temps les données que l’on analyse proviennent de fichiers. La fonction la 
plus simple à prendre en main est np. loadtxt (). Celle-ci lit un fichier organisé en lignes / colonnes. Par exemple, imaginons 
que nous ayons un fichier donnees . dat contenant : 


1 7 310 
15 -4 35 
78 95 79 


La fonction prend en argument le nom du fichier et renvoie un array 2D directement : 


>>> np.loadtxt ("donnees.dat") 


array([[ 1., 7., B10.) 5 
[ 15., -4., 35.], 
[ 78., 95., 79.]]) 


Pratique, non? Attention toutefois aux points suivants : 

— chaque ligne doit avoir le même nombre de colonnes, la fonction ne gère pas les données manquantes ; 

— chaque donnée est convertie en float, donc si une chaîne est rencontrée la fonction renvoie une erreur; 

— par défaut, les données doivent être séparées par n’importe quelle combinaison d’espace(s) et/ou de tabulations. 

Nous vous conseillons vivement de consulter la documentation complète © de cette fonction. np.loadtxt() contient tout 
un tas d’arguments par mot-clé permettant de récupérer telles ou telles lignes / colonnes, ignorer des lignes de commentaire, 
changer le séparateur par défaut (par exemple la virgule , pour les fichiers .csv), etc., qui peuvent se révéler commodes. 

L'opération inverse consistant à sauver un array dans un fichier se fait avec la fonction np.savetxt () : 


>>> a = np.reshape(range(1, 10), (3, 3)) 


>>> a 
array([[1, 2, 3], 
[4, 5, 6], 
[7, 8, 9]]) 
>>> np.savetxt("out.dat", a) 


Ceci générera le fichier out .dat contenant les lignes suivantes : 


1.000000000000000000e+00 2.000000000000000000e+00 3.000000000000000000e+00 

4.000000000000000000e+00 5.000000000000000000e+00 6.000000000000000000e+00 

7 .000000000000000000e+00 8.000000000000000000e+00 9.000000000000000000e+00 

On voit que la fonction écrit par défaut les données comme des floats en notation scientifique. Bien sûr il existe de 
nombreuses options possibles ’ permettant de changer le format, les séparateurs, etc. 


Pour aller plus loin 


6. https: //numpy.org/doc/stable/reference/generated/numpy.loadtxt.html 
7. https: //numpy.org/doc/stable/reference/generated/numpy.savetxt.html 
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Il existe d’autres fonctions plus avancées telles que np.genfromttxt() gérant les données manquantes, ou encore np.load() ° 
et np.fromfile() !° permettant de lire des données au format binaire. De même, il existe des fonctions ou méthodes permettant 
d’écrire au format binaire : np.save() !! ou .tofile() '?. Le format binaire possède en général l'extension .npy ou .npz lorsque 
les données sont compressées. L'avantage d’écrire au format binaire est que cela prend moins de place pour les gros tableaux. 


17.1.7 Un peu d’algèbre linéaire 

Après avoir manipulé les objets array comme des vecteurs et des matrices, voici quelques fonctions pour faire de l’algèbre 
linéaire. 

La fonction transpose () renvoie la transposée |? d’un array. Par exemple, pour une matrice : 


>>> a = np.resize(np.arange(1, 10), (3, 3)) 


>>> a 

array([[1, 2, 3], 
[4, 5, 6], 
[7, 8, 9]]) 


>>> np.transpose(a) 

array([[1, 4, 7], 
2 5: 8l; 
[3, 6, 9]]) 


Tout objet array possède un attribut .T qui contient la transposée, il est ainsi possible d’utiliser cette notation objet plus 
compacte : 


>>> a.T 
array([[1, 4, 7], 
[2, 5, 8], 
[3, 6, 9]]) 
La fonction dot () permet de multiplier deux matrices *. 
>>> a = np.resize(np.arange(4), (2, 2)) 
>>> a 
array([[o, 1], 
(2, 3]]) 


>>> np.dot(a, a) 
array([[ 2, 3], 
[ 6, 11]]) 


>>> a*a 
array ([[O, 1], 
[4, 9]]) 


Notez bien que dot (a, a) renvoie le produit matriciel entre deux matrices, alors que a * a renvoie le produit élément 
par élément. 


Remarque 
Dans le module NumPy, il existe également des objets de type matrix pour lesquels les multiplications de matrices sont 
différents, mais nous ne les aborderons pas ici. 


Pour toutes les opérations suivantes, nous utiliserons des fonctions du sous-module linalg de NumPy. La fonction inv () 
renvoie l’inverse d’une matrice carrée !*, det () son déterminant |? et eig() ses vecteurs et valeurs propres !?. 
>>> a = np.diag((1, 2, 3)) 
>>> a 
array ([[1, 0, 0], 
[0, 2, 01, 


8. https: //numpy.org/doc/stable/reference/generated/numpy.genfromtxt.html 

9. https: //numpy.org/doc/stable/reference/generated/numpy.load.html 

10. https: //numpy.org/doc/stable/reference/generated/numpy.fromfile.html 

11. https: //numpy.org/doc/stable/reference/generated/numpy.save.html 

12. https://numpy.org/doc/stable/reference/generated/numpy.ndarray.tofile.html#numpy.ndarray.tofile 
13. https: //fr.wikipedia.org/wiki/Matrice_transpos/C3/A9e 

14. https://fr.wikipedia. org/wiki/Produit_matriciel#Produit_matriciel_ordinaire 

15. https://fr.wikipedia. org/wiki/Matrice_inversible 

16. https://fr.wikipedia. org/wiki/Calcul_du_d/C3/A9terminant _d/27une_matrice 

17. https://fr.wikipedia.org/wiki/D/4C3/%A9composition_d/27une matrice_en_#C3/%A91/C3/A9ments_propres 
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(0, 0, 311) 

>>> np.linalg.inv(a) 

array ([[1. 0 , 0. 1, 
to. » 0.5 >» 0. 1, 
Co. , 0 , 0.33333333]]) 

>>> np.linalg.det(a) 


6.0 
>>> np.linalg.eig(a 
(array([1., 2., 3 
[0., 1., 0 
1 


) 
), array([[1., 0., 0.], 
[o., 0., 1.1] 


.] 
-J 
.11)) 


Ligne 1. La fonction .diag() permet de générer une matrice diagonale. 

Lignes 12 à 15. La fonction eig() renvoie un tuple dont le premier élément (d’indice 0) correspond aux valeurs propres 
et le second (d’indice 1) aux vecteurs propres. Une façon commode de récupérer ces éléments est d’utiliser cette fonction avec 
ľ affectation multiple : 


>>> eigvals, eigvecs = np.linalg.eig(a) 
>>> eigvals 
array ([1., 2., 3.]) 
>>> eigvecs 
array ([[1., 0., 0.] 
CO: , Les 041 
Or 0 ta] 
>>> eigvecs [0] 
array([1., 0., 0.]) 
>>> eigvecs [1] 
array([l0., 1., 0.]) 
>>> eigvecs [2] 
array([0., 0., 1.]) 


1) 


Lignes 2 et 3. eigvals est un array 1D contenant les 3 valeurs propres. 
Lignes 4 à 13. eigvecs est un array 2D contenant les 3 vecteurs propres (un par ligne), que l’on peut récupérer avec 
eigvecs [0], eigvecs[1] et eigvecs [2]. 


17.18 Parcours de matrice et affectation de lignes / colonnes 


Lorqu’on a une matrice, on est souvent amené à la parcourir par ligne ou par colonne. Une fonctionnalité bien commode 
vient du fait que les arrays NumPy sont directement itérables par ligne : 


>>> a = np.reshape(np.arange(1, 10), (3, 3)) 


>>> a 

array([[1, 2, 3], 
[4, 5, 6], 
[7, 8, 911) 


>>> for row in a: 
print(row, type(row)) 


[1 2 3] <class 'numpy.ndarray'> 
[4 5 6] <class 'numpy.ndarray'> 
[7 8 9] <class 'numpy.ndarray'> 


À chaque itération, la variable row est un array 1D correspondant à chaque ligne de a. Cela est lié au fait que l’utilisation 
d’un indiçage unique a[i] pour un array 2D correspond à sa ligne d’ indice i (cf. rubrique Indices ci-dessus). 
Pour itérer sur les colonnes, on pourra utiliser l’astuce d’itérer sur la transposée de l’array a, c’est-à-dire a.T : 
>>> for col in a.T: 


print(col, type(col)) 


[1 4 7] <class 'numpy.ndarray'> 
[2 5 8] <class 'numpy.ndarray'> 
[3 6 9] <class 'numpy.ndarray'> 


À chaque itération, la variable col est un array 1D correspondant à chaque colonne de a. 
On se souvient de l’affectation multiple x, y = 1, 2 qui permettait d’affecter des valeurs à plusieurs variables à la fois. 
Et bien, il est possible d’utiliser cette fonctionnalité aussi avec les arrays NumPy : 


>>> a 

array([[1, 2, 3], 
[4, 5, 6], 
[7, 8, 911) 

>>> 11, 12, 13 = a 

>>> 11 
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array ([1, 2, 3]) 
>>> 12 
array ([4, 5, 61) 
>>> 13 
array ([7, 8, 9]) 


Par défaut, cela se fait sur les lignes de l’array 2D. Cette fonctionnalité provient à nouveau du fait que pour NumPy a[i] 


correspond à la ligne d’indice i d’un array 2D. 
Pour utiliser l’affectation multiple sur les colonnes, il suffit d’utiliser la transposée a.T : 


>>> ci, c2, c3 = a.T 


>>> ci 
array ([1, 4, 7]) 
>>> c2 
array ([2, 5, 81) 
>>> c3 


array ([3, 6, 91) 


17.1.9 Masques booléens 


Une des grandes puissance des arrays NumPy est qu’ils supportent les masques booléens. Avant de les définir, il est 
important d’introduire le concept d’arrays de booléens. Jusqu’à maintenant nous avions définis uniquement des arrays avec 
des types numériques int ou float. Il est tout à fait possible de définir des arrays de booléens. La fonction np.fu11() vue 


ci-dessus nous permet d’en construire facilement : 


>>> np.full((2, 2), True) 
array ([[ True, True], 

[ True, True]]) 
>>> np.full((2, 2), False) 
array([[False, False], 

[False, False]]) 


Très bien, mais au premier abord nous n’en voyons pas forcément l’utilité... Mais qu’en est-il lorsqu’on utilise les opéra- 


teurs de comparaison avec un array ? Et bien cela renvoie un array de booléens ! 


>>> a = np.reshape(np.arange(1, 10), (3, 3)) 


>>> a 

array ([[1, 2, 3], 
[4, 5, 6], 
[7, 8, 9]]) 


>>> a> 5 

array([[False, False, False], 
[False, False, True], 
[ True, True, True]]) 

>>> a == 

array ([[False, True, False], 
[False, False, False], 
[False, False, False]]) 


Tous les éléments de l’array satisfaisant la condition seront à True, les autres à False. Encore plus fort, il est possible de 


combiner plusieurs conditions avec les opérateurs logiques & et | (respectivement ET et OU) : 


>>> a 
array([[1, 2, 3], 
[4, 5, 6], 
[7, 8, 9]]) 
>>> (a > 3) & (a % 2 == 0) 
array([[False, False, False], 
[ True, False, True], 
[False, True, False]]) 
>>> (a > 3) | (a % 2 == 0) 
array([[False, True, False], 
[ True, True, True], 
[ True, True, True]]) 


Nous pouvons effectuer deux remarques : 


— Les opérateurs logiques & et | s’appliquent sur les arrays et sont différents des opérateurs logiques and et or qui eux 


s’appliquent sur les booléens (True ou False); 
— Il est conseillé de mettre des parenthèses pour chaque condition afin d'éviter les ambiguités. 


Maintenant que les arrays de booléens ont été introduits, nous pouvons définir les masques booléens : 


Définition 
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Les masques booléens sont des arrays de booléens qui sont utilisés en tant qu’« indice » d’un array initial. Cela permet 
de récupérer / modifier une partie de l’array initial. 


Concrètement, il suffira d’utiliser un array et un opérateur de comparaison entre les crochets qui étaient dédiés à l’indi- 


çage : 
>>> a 
array([[1, 2, 3], 
[4, 5, 6], 
[7, 8, 9]]) 


>>> ala > 5] 
array([6, 7, 8, 9]) 


>>> ala == 2] 
array([2]) 
>>> ala != 0] 


array([1, 2, 3, 4, 5, 6, 7, 8, 91) 


On voit que l’on récupère seulement les éléments de l’array a qui sastisfont la sélection! Toutefois, il est important de 
constater que l’array renvoyé perd la dimensionnalité de l’array a initial, il s’agit systématiquement d’un array 1D. 
La grande puissance de ce mécanisme est que l’on peut utiliser les masques booléens pour modifier les éléments que l’on 


sélectionne : 
>>> a 
array([[1, 2, 3], 
[4, 5, 6], 
[7, 8, 9]]) 


>>> ala > 5] 
array([6, 7, 8, 9]) 


>>> ala > 5] = -1 
>>> a 
array ([[ 1, 2, 3], 
[ 4, 5, -1], 
[-1, -1, -1]]) 
On peut bien sûr combiner plusieurs conditions avec les opérateurs logiques : 
>>> a 
array([[1, 2, 3], 
[4, 5, 6], 
[7, 8, 911) 
>>> alla > 3) | (a % 2 == 0)] = 0 
>>> a 
array([[1, 0, 3], 
(0, 0, 0], 
[0, 0, 0]]) 


Ce mécanisme de sélection avec des masques booléens se révéle trés puissant pour manipuler des grandes quantités de 
données. On verra qu’il peut étre également utilisé avec les dataframes du module pandas. 


Remarque 
Les masques booléens ne doivent pas être confondus avec les masked arrays '* qui sont des arrays dans lesquels on peut 
trouver des valeurs manquantes ou invalides. 


Une application possible des masques est de « binariser » une matrice de nombre : 


>>> import random as rd 
>>> import numpy as np 
>>> a = np.resize([rd.random() for i in range(16)], (4, 


4)) 


>>> a 


array ([[0.58704728, 0.50212977, 0.70652863, 0.24158108], 
[0.93102132, 0.41864373, 0.45807961, 0.98288744] , 
[0.48198211, 0.16877376, 0.14431518, 0.74784176] , 
[0.92913469, 0.08383269, 0.10670144, 0.14554345]]) 

>>> seuil = 0.3 

>>> ala < seuil] = 0 

>>> ala > seuil] = 1 

>>> a 


array ([[1., 1., 1., 0.], 


18. https://numpy.org/doc/1.18/reference/maskedarray.html 
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His des ts als 
Etsy Oe, Ory 1:13 
[1., 0., 0., 0.]]) 


En deux lignes de code cela est fait alors qu’il aurait fallu faire des boucles avec les listes classiques ! 


17.1.10 Quelques conseils 


Nous venons de voir une petite partie du module NumPy mais vous avez pu en constater son extraordinaire puissance. On 
pourrait au premier abord être tenté d’abandonner les listes, toutefois elles gardent toute leur importance. Alors quand utiliser 
les listes ou quand utiliser les arrays NumPy? Voici une liste non exhaustive d’éléments qui peuvent guider votre choix : 

Utilisez NumPy pour : 

— les opérations vectorielles (éléments par éléments) ; 

— lorsque vous souhaitez manipuler des objets mathématiques (vecteurs, matrices, etc.) et les outils associés (algèbre 
linéaire) ; 

— tout ce qui est numérique de manière générale. 

Utilisez les listes : 

— lorsque vous avez besoin d’un container pour accumuler des valeurs (fussent-elles des sous-listes), surtout lorsqu’ elles 
ne sont pas homogènes (i.e. du même type); 

— lorsque vous souhaitez accumuler des valeurs : la méthode . append () est bien plus efficace que faire grandir un array 
au fur et à mesure (ce que nous n’avons pas abordé); lorsqu’on ne peut pas utiliser les fonctions de lecture de fichier 
de NumPy pour quelque raison que ce soit, il est tout à fait classique de faire grandir une liste au fur et à mesure de la 
lecture du fichier puis de la convertir à la fin en array. 

Enfin, comme nous vous le conseillons depuis le début, soignez bien votre documentation (docstrings) ou vos commen- 
taires lorsque vous utilisez des arrays NumPy. Numpy permettant de réaliser des opérations vectorielles de maniére trés com- 
pacte, il est essentiel de se mettre à la place du lecteur et de bien indiquer ce que contient chaque array et sa dimensionnalité 
(1D, 2D, etc.). 

Le module NumPy est la brique de base pour tout ce qui est numérique. Associé aux modules SciPy et matplotlib (et aussi 
aux notebooks Jupyter, voir le chapitre suivant), il permet de faire de l’analyse scientifique. On verra un peu plus loin dans 
ce chapitre que la puissance de NumPy est également utilisée par le module pandas et ses fameux dataframes pour faire de 
analyse de données. 


Pour aller plus loin 
— Le livre de Nicolas Rougier From Python to Numpy '? est une très bonne ressource pour explorer plus en détails les 
possibilités de NumPy. L'auteur y aborde notamment la puissante notion de « masque ». 
— Les tutoriels °° proposés par l’équipe de développement de NumPy sont également un excellent moyen de poursuivre 
votre découverte de cette bibliothèque incontournable en sciences. 


17.2 Module Biopython 


Le module Biopython ?' propose des fonctionnalités très utiles en bioinformatique. Le tutoriel ? est particulièrement bien 
fait, n’hésitez pas à le consulter. 


17.2.1 Manipulation de données 


Voici quelques exemples de manipulation de données avec Biopython. 
Définition d’une séquence : 


>>> import Bio 

>>> from Bio.Seq import Seq 

>>> ADN = Seq("ATATCGGCTATAGCATGC") 
>>> ADN 

Seq('ATATCGGCTATAGCATGC ') 


19. https://wuw.labri.fr/perso/nrougier/from-python-to-numpy/ 
20. https://numpy.org/numpy-tutorials/index.html 

21. http://biopython.org/ 

22. http://biopython.org/DIST/docs/tutorial/Tutorial.html 
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Ligne 1. Le module Biopython s'appelle Bio. 
Obtention de la séquence complémentaire et complémentaire inverse : 


>>> ADN.complement () 
Seq('TATAGCCGATATCGTACG ') 
>>> ADN.reverse_complement () 
Seq ('GCATGCTATAGCCGATAT ') 


Traduction en séquence protéique : 


>>> ADN.translate() 
Seq('ISAIAC') 


Dans l’ annexe A Quelques formats de données rencontrés en biologie, vous trouverez de nombreux exemples d'utilisation 
de Biopython pour manipuler des données aux formats FASTA, GenBank et PDB. 


17.2.2 Interrogation de la base de données PubMed 


Le sous-module Entrez de Biopython permet d’utiliser les ressources du NCBI et notamment d’interroger le site Pub- 


2 

Med”. 

Nous allons par exemple utiliser PubMed pour chercher des articles scientifiques relatifs à la transferrine (transferrin en 
anglais) : 

>>> from Bio import Entrez 

>>> Entrez.email = "votremail@provider.fr" 

>>> req_esearch = Entrez.esearch(db="pubmed", term="transferrin") 

>>> res_esearch = Entrez.read(req_esearch) 


Ligne 1. On charge directement le sous-module Entrez. 
Ligne 2. Lors d’une requéte sur le site du NCBI, il est important de définir correctement la variable Entrez.email qui 
sera transmise au NCBI lors de la requéte et qui pourra étre utilisée pour vous contacter en cas de difficulté avec le serveur. 
Ligne 3. On lance la requéte (transferrin) sur le moteur de recherche pubmed. La requéte est stockée dans la variable 
req_esearch. 
Ligne 4. Le résultat est lu et stocké dans la variable res_esearch. 
Sans étre un vrai dictionnaire, la variable res_esearch en a cependant plusieurs propriétés. Voici ses clés : 
>>> res_esearch.keys() 


dict_keys(['Count', 'RetMax', 'RetStart', 'IdList', 'TranslationSet', 
'TranslationStack', 'QueryTranslation']) 


La valeur associée à la clé IdList est une liste qui contient les identifiants (PMID) des articles scientifiques associés à la 
requête (ici transferrin) : 


>>> res_esearch["IdList"] 


['30411489', '30409795', '30405884', '30405827', '30402883', '30401570', 
'30399508', '30397276', '30395963', '30394734', '30394728', '30394123', 
'30393423', '30392910', '30392664', '30391706', '30391651', '30391537', 
'30391296', '30390672'] 

>>> len(res_esearch["IdList"]) 

20 


Cette liste ne contient les identifiants que de 20 publications alors que si nous faisons cette méme requéte directement sur 
le site de PubMed depuis un navigateur web, nous obtenons plus de 33900 résultats. 
En réalité, le nombre exact de publications est connu : 


>>> res_esearch["Count"] 
'33988' 
Pour ne pas saturer les serveurs du NCBI, seulement 20 PMID sont renvoyés par défaut. Mais vous pouvez augmenter 
cette limite en utilisant le paramétre retmax dans la fonction Entrez.esearch(). 
Nous pouvons maintenant récupérer des informations sur une publication précise en connaissant son PMID. Par exemple, 
Particle avec le PMID 22294463 ** dont un aperçu est sur la figure 17.2. 
Nous allons pour cela utiliser la fonction Entrez.esummary () 


>>> req_esummary = Entrez.esummary(db="pubmed", id="22294463") 
>>> res_esummary = Entrez.read(req_esummary) 


23. https://www.ncbi.nlm.nih.gov/pubmed/ 
24. https://www.ncbi.nlm.nih. gov/pubmed/22294463 
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Biometals. 2012 Aug;25(4):677-86. doi: 10.1007/s10534-012-9520-3. 


Known and potential roles of transferrin in iron biology. 
Bartnikas TB’. 


+) Author information 


Abstract 

Transferrin is an abundant serum metal-binding protein best known for its role in iron delivery. The human disease congenital atransferrinemia 
and animal models of this disease highlight the essential role of transferrin in erythropoiesis and iron metabolism. Patients and mice deficient 
in transferrin exhibit anemia and a paradoxical iron overload attributed to deficiency in hepcidin, a peptide hormone synthesized largely by the 
liver that inhibits dietary iron absorption and macrophage iron efflux. Studies of inherited human disease and model organisms indicate that 
transferrin is an essential regulator of hepcidin expression. In this paper, we review current literature on transferrin deficiency and present our 
recent findings, including potential overlaps between transferrin, iron and manganese in the regulation of hepcidin expression. 


PMID: 22294463 PMCID: PMC3595092 DOI: 10.1007/s10534-012-9520-3 


FIGURE 17.2 — Aperçu de la publication Known and potential roles of transferrin in iron biology depuis le site PubMed. 


La variable res_esummary n’est pas réellement une liste mais en a plusieurs propriétés. Cette pseudo-liste n’a qu’un seul 
élément, qui est lui-même un pseudo-dictionnaire dont voici les clés : 


>>> res_esummary [0] . keys () 
dict_keys(['Item', 'Id', 'PubDate', 'EPubDate', 'Source', 'AuthorList', 


'LastAuthor', 'Title', 'Volume', 'Issue', 'Pages', 'LangList', 
'NlmUniqueID', 'ISSN', 'ESSN', 'PubTypeList', 'RecordStatus', 'PubStatus', 
'Articlelds', 'DOI', 'History', 'References', 'HasAbstract', 'PmcRefCount', 


'FullJournalName', 'ELocationID', 'S0']) 


Nous pouvons alors facilement obtenir le titre, le DOI et la date de publication (PubDate) de cet article, ainsi que le journal 
(Source) dans lequel il a été publié : 


>>> res_esummary [0] ["Title"] 

'Known and potential roles of transferrin in iron biology.' 
>>> res_esummary[0]["D01"] 

'10.1007/s10534-012-9520-3' 

>>> res_esummary [0] ["PubDate"] 

"2012 Aug' 

>>> res_esummary [0] ["Source"] 

'Biometals' 


Enfin, pour récupérer le résumé de la publication précédente, nous allons utiliser la fonction Entrez.efetch() : 


>>> req_efetch = Entrez.efetch(db="pubmed", id="22294463", rettype="txt") 
>>> res_efetch = Entrez.read(req_efetch) 


La variable res_efetch est un pseudo-dictionnaire qui contient une pseudo-liste, qui contient un pseudo-dictionnaire, 
qui contient... Oui, c’est compliqué ! Pour faire court, le résumé peut s’obtenir avec l’instruction : 


>>> res_efetch['PubmedArticle'][0]['MedlineCitation']['Article'] \ 
... ['Abstract']['AbstractText '] [0] 
‘Transferrin is an abundant serum metal-binding protein best known 
for its role in iron delivery. The human disease congenital atransf 
errinemia and animal models of this disease highlight the essential 
role of transferrin in erythropoiesis and iron metabolism. Patient 
s and mice deficient in transferrin exhibit anemia and a paradoxica 
1 iron overload attributed to deficiency in hepcidin, a peptide hor 
mone synthesized largely by the liver that inhibits dietary iron ab 
sorption and macrophage iron efflux. Studies of inherited human dis 
ease and model organisms indicate that transferrin is an essential 
regulator of hepcidin expression. In this paper, we review current 
literature on transferrin deficiency and present our recent finding 
s, including potential overlaps between transferrin, iron and manga 
nese in the regulation of hepcidin expression.' 


Ce qui est bien le résumé que nous obtenons sur la figure 17.2. 


17.3 Module matplotlib 


Le module matplotlib> permet de générer des graphiques depuis Python. Il est l’outil complémentaire de NumPy, scipy 
ou pandas (que l’on verra juste après) lorsqu’on veut faire de l’analyse de données. 


25. https://matplotlib.org/ 
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17.3.1 Représentation sous forme de points 


Dans cet exemple, nous considérons l’évolution de la concentration d’un produit dans le sang (exprimé en mg/L) en 
fonction du temps (exprimé en heure). 
Nous avons les résultats suivants : 


Temps (h) Concentration (mg/L) 


1 3.5 
5.8 
9.1 
11.8 
17.5 
21.3 
26.8 


© OA À © D 


Nous allons maintenant représenter l’évolution de la concentration en fonction du temps : 


import matplotlib.pyplot as plt 


temps = [1, 2, 3, 4, 6, 7, 9] 

concentration = [5.5, 7.2, 11.8, 13.6, 19.1, 21.7, 29.4] 
plt.scatter(temps, concentration, marker="o", color="blue") 
plt.xlabel("Temps (h)") 

plt.ylabel("Concentration (mg/L)") 

plt.title ("Concentration de produit en fonction du temps") 
plt.show() 


Vous devriez obtenir une fenêtre graphique interactive qui vous permet de manipuler le graphe (se déplacer, zoomer, 
enregistrer comme image, etc.) et qui ressemble à celle de la figure 17.3. 

Revenons maintenant sur le code. 

Ligne 1. Tout d’abord, on importe le sous-module pyplot du module matplotlib et on lui donne l’alias plt pour l'utiliser 
plus rapidement ensuite (cet alias est standard, utilisez-la systématiquement). 

Lignes 3 et 4. On définit les variables temps et concentration comme des listes. Les deux listes doivent avoir la même 
longueur (7 éléments dans le cas présent). 

Ligne 5. La fonction scatter() permet de représenter des points sous forme de nuage de points. Les deux premiers 
arguments correspondent aux valeurs en abscisse et en ordonnée des points, fournis sous forme de listes. Des arguments 
facultatifs sont ensuite précisés comme le symbole (marker) et la couleur (color). 

Lignes 6 et 7. Les fonctions xlabel() et ylabel() sont utilisées pour donner un nom aux axes. 

Ligne 8. La fonction title () définit le titre du graphique. 

Ligne 9. Enfin, la fonction show () affiche le graphique généré à l’écran. 


17.3.2 Représentation sous forme de courbe 


On sait par ailleurs que l’évolution de la concentration du produit en fonction du temps peut-être modélisée par la fonction 
f(x) =2+3 x x. Représentons ce modèle avec les points expérimentaux et sauvegardons le graphique obtenu sous forme 
d’une image : 


import numpy as np 
import matplotlib.pyplot as plt 


temps = [1, 2, 3, 4, 6, 7, 9] 

concentration = [5.5, 7.2, 11.8, 13.6, 19.1, 21.7, 29.4] 
plt.scatter(temps, concentration, marker="o", color = "blue") 
plt.xlabel("Temps (h)") 

plt.ylabel("Concentration (mg/L)") 

plt.title ("Concentration de produit en fonction du temps") 


x = np.linspace(min(temps), max(temps), 50) 

y = 2 + 3 * x 

plt.plot(x, y, color='green', ls="--") 

plt.grid() 

plt.savefig("concentration_vs_temps.png", bbox_inches='tight', dpi=200) 


Le résultat est représenté sur la figure 17.4. 
Les étapes supplémentaires par rapport au graphique précédent (figure 17.3) sont : 
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FIGURE 17.3 — Fenêtre interactive de matplotlib. 
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FIGURE 17.4 — Concentration du produit en fonction du temps. 
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Ligne 1. On charge le module numpy sous le nom np. 

Ligne 10. On crée la variable x avec la fonction linspace() du module NumPy qui renvoie une liste de valeurs réguliè- 
rement espacées entre deux bornes, ici entre le minimum (min (temps) ) et le maximum (max (temps) ) de la variable temps. 
Dans notre exemple, nous générons une liste de 50 valeurs. La variable x ainsi créée est du type array. 

Ligne 11. On construit ensuite la variable y à partir de la formule modélisant l’évolution de la concentration en fonction du 
temps. Cette manipulation n’est possible que parce que x est du type array. Cela ne fonctionnerait pas avec une liste classique. 

Ligne 12. La fonction plot () permet de construire une courbe à partir des coordonnées en abscisse et en ordonnées des 
points à représenter. On indique ensuite des arguments facultatifs comme le style de la ligne (1s) et sa couleur (color). 

Ligne 13. La fonction grid() affiche une grille. 

Ligne 14. Enfin, la fonction savefig() enregistre le graphique produit sous la forme d’une image au format png. Des 
arguments par mot-clé définissent la manière de générer les marges autour du graphique (bbox_inches) et la résolution de 
l’image (dpi). 


17.3.3 Représentation sous forme de diagramme en bâtons 


On souhaite maintenant représenter graphiquement la distribution des différentes bases dans une séquence d’ ADN. 


import numpy as np 
import matplotlib.pyplot as plt 


sequence = "ACGATCATAGCGAGCTACGTAGAA" 
bases = ["A", "c", "G", "T"] 
distribution = [] 


for base in bases: 
distribution. append (sequence. count (base) ) 


x = np.arange(len(bases)) 

plt.bar(x, distribution) 

plt.xticks(x, bases) 

plt.xlabel ("Bases") 

plt.ylabel ("Nombre") 

plt.title(f"Distribution des bases\n dans la séquence {sequence}") 
plt.savefig("distribution_bases.png", bbox_inches="tight", dpi=200) 


On obtient alors le graphique de la figure 17.5. 
Prenons le temps d’examiner les différentes étapes du script précédent : 
Lignes 4 4 6. On définit les variables sequence, bases et distribution qu’on utilise ensuite. 


Lignes 7 et 8. On calcule la distribution des différentes bases dans la séquence. On utilise pour cela la méthode count () 
qui renvoie le nombre de fois qu’une chaîne de caractères (les différentes bases) se trouve dans une autre (la séquence). 

Ligne 10. On définit la position en abscisse des barres. Dans cet exemple, la variable x vaut array([0, 1, 2, 3]). 

Ligne 11. La fonction bar () construit le diagramme en bâtons. Elle prend en argument la position des barres (x) et leurs 
hauteurs (distribution). 

Ligne 12. La fonction xtics() redéfinit les étiquettes (c’est-à-dire le nom des bases) sur l’axe des abscisses. 

Lignes 13 à 15. On définit les légendes des axes et le titre du graphique. On insère un retour à la ligne \n dans le titre pour 
qu’il soit réparti sur deux lignes. 

Ligne 16. Enfin, on enregistre le graphique généré au format png. 


On espère que ces courts exemples vous auront convaincu de l’utilité du module matplotlib. Sachez qu’ il peut faire bien 
plus, par exemple générer des histogrammes ou toutes sortes de graphiques utiles en analyse de données. 


Pour aller plus loin 
— Le site de matplotlib fournit de nombreux exemples détaillés *°, n’hésitez pas à le consulter. 
— Le site Python Graph Gallery ? propose aussi des exemples de code pour différents types de graphiques. 
— Enfin, des cheat sheets?’ de matplotlib sont aussi disponibles. 


26. https://matplotlib.org/gallery/index.html 
27. https://www.python-graph-gallery.com/matplotlib/ 
28. https://github.com/matplotlib/cheatsheets 
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FIGURE 17.5 — Distribution des bases. 


17.4 Module pandas 


Le module pandas ” a été conçu pour l’analyse de données. Il est particulièrement puissant pour manipuler des données 


structurées sous forme de tableau. 
Pour charger pandas dans la mémoire de Python, on utilise la commande import habituelle : 


1 >>> import pandas 
Pandas est souvent chargé avec un nom raccourci, comme pour NumPy et matplotlib : 


1 >>> import pandas as pd 


17.4.1 Series 


Le premier type de données apporté par pandas est la series, qui correspond à un vecteur à une dimension. 


| >>> s = pd.Series([10, 20, 30, 40], index = ['a', 'b', 'c', 'd']) 
2 >>> B 
a 10 
4b 20 
c 30 
él d 40 


7 dtype: int64 

Avec pandas, chaque élément de la série de données possède une étiquette qui permet d’appeler les éléments. Ainsi, pour 
appeler le premier élément de la série, on peut utiliser son index, comme pour une liste (0 pour le premier élément) ou son 
étiquette (ici, "a") : 


>>> s[0] 
10 

>>> s["a"] 
10 


1 
2 


3 
4 


Bien sûr, on peut extraire plusieurs éléments, par leurs indices ou leurs étiquettes : 


29. https://pandas.pydata.org/ 
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>>> s[[1, 3]] 


b 20 

d 40 

dtype: int64 

>>> s[["b", “d"]] 
b 20 

d 40 


dtype: int64 


Les étiquettes permettent de modifier et d’ajouter des éléments : 


>>> s["c"] = 300 
>>> s["z"] = 50 


Enfin, on peut filtrer une partie de la series : 


>>> s[s>30] 


c 300 
d 40 
Zz 50 


dtype: int64 


et méme combiner plusieurs critéres de sélection : 


>>> s[(s>20) & (s<100)] 
d 40 

Zz 50 

dtype: int64 


17.4.2 Dataframes 


Un autre type d’ objet particulièrement intéressant introduit par pandas sont les dataframes. Ceux-ci correspondent à des 


tableaux 4 deux dimensions avec des étiquettes pour nommer les lignes et les colonnes. 


Remarque 


Si vous êtes familier avec le langage de programmation et d’ analyse statistique R, les dataframes de pandas se rapprochent 


de ceux trouvés dans R. 
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Voici comment créer un dataframe avec pandas à partir de données fournies comme liste de lignes : 


>>> df = pd.DataFrame(columns=["a", "b", "c", "d"], 
index=["chat", "singe", "souris"], 
data=[np.arange(10, 14), 

np.arange(20, 24), 
wnt np.arange (30, 34)]) 
>>> df 

a b c d 

chat 10 11 12 13 
singe 20 -21 22 23 
souris 30 31 32 33 


Ligne 1. Le dataframe est créé avec la fonction DataFrame() à laquelle on fournit plusieurs arguments. L’argument 


columns indique le nom des colonnes, sous forme d’une liste. 


Ligne 2. L’argument index définit le nom des lignes, sous forme de liste. 
Lignes 3-5. L’argument data fournit le contenu du dataframe, sous la forme d’une liste de valeurs correspondantes à des 


lignes. Ainsi np.arange(10, 14) qui est équivalent à [10, 11, 12, 13] correspond à la première ligne du dataframe. 
Notez ici qu'il faut avoir préalablement importer numpy avec l'instruction import numpy as np. 


Le même dataframe peut aussi être créé à partir des valeurs fournies en colonnes sous la forme d’un dictionnaire : 


>>> data = {"a": np.arange(10, 40, 10), 
"b": np.arange(11, 40, 10), 
"c": np.arange(12, 40, 10), 

lat "d": np.arange(13, 40, 10)} 

>>> df = pd.DataFrame (data) 

>>> df.index = ["chat", "singe", "souris"] 

>>> df 
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a b c d 
chat 10 11 12 13 
singe 20 21 22 23 
souris 30 31 32 33 
Lignes 1-4. Le dictionnaire data contient les données en colonnes. La clé associée à chaque colonne est le nom de la 
colonne. 
Ligne 5. Le dataframe est créé avec la fonction pd .DataFrame () à laquelle on passe data en argument. 


Ligne 6. On peut définir les étiquettes des lignes de n’importe quel dataframe avec l'attribut df . index. 


17.4.3 Quelques propriétés 


Les dimensions d’un dataframe sont données par l’attribut . shape : 
>>> df.shape 
(3, 4) 
Ici, le dataframe df a 3 lignes et 4 colonnes. 
L’attribut . columns renvoie le nom des colonnes et permet aussi de renommer les colonnes d’un dataframe : 


>>> df.columns 


Index(['a', 'b', 'c', 'd'], dtype='object') 
>>> df.columns = ["Paris", "Lyon", "Nantes", "Pau"] 
>>> df 
Paris Lyon Nantes Pau 
chat 10 11 12 13 
singe 20 21 22 23 
souris 30 31 32 33 


La méthode .head(n) renvoie les n premières lignes du dataframe (par défaut, n vaut 5) : 


>>> df.head (2) 

Paris Lyon Nantes Pau 
chat 10 11 12 13 
singe 20 21 22 23 


17.4.4 Sélection 


Les mécanismes de sélection fournis avec pandas sont très puissants. En voici un rapide aperçu : 


Sélection de colonnes 


On peut sélectionner une colonne par son étiquette : 


>>> df["Lyon"] 


chat 11 
singe 21 
souris 31 


ou plusieurs colonnes en même temps : 


>>> dfC["Lyon", "Pau"]] 
Lyon Pau 

chat 11 13 

singe 21 23 

souris 31 33 


Pour la sélection de plusieurs colonnes, les étiquettes d’intérêt sont rassemblées dans une liste. 


Sélection de lignes 


Pour sélectionner une ligne, il faut utiliser l’instruction . 1oc() et l’étiquette de la ligne : 


>>> df.loc["singe"] 
20 


Paris 

Lyon 21 
Nantes 22 
Pau 23 


Name: singe, dtype: int64 


Ici aussi, on peut sélectionner plusieurs lignes : 
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>>> df.loc[["singe", 


Paris Lyon 
singe 20 21 
chat 10 11 


n chat "] ] 
Nantes Pau 
22 23 
12 13 


Enfin, on peut aussi sélectionner des lignes avec l’instruction . iloc et l’indice de la ligne (la première ligne ayant l’indice 


0): 


>>> df.iloc[1] 
Paris 20 
Lyon 21 
Nantes 22 
Pau 23 


Name: singe, dtype: 


>>> df.iloc[[1,0]] 

Paris Lyon 
singe 20 21 
chat 10 11 


On peut également utiliser les tranches (comme pour les listes) : 


>>> df.iloc [0:2] 
Paris Lyon 

chat 10 11 

singe 20 21 


int64 


Nantes 
22 
12 


Nantes 
12 
22 


Pau 
23 
13 


Pau 
13 
23 


Sélection sur les lignes et les colonnes 


On peut bien sûr combiner les deux types de sélection (en ligne et en colonne) : 


>>> df.loc["souris", 


33 


>>> df.loc[["singe", 

Nantes Lyon 
singe 22 21 
souris 32 31 


"Pau"] 


"souris"], 


['Nantes', 


'Lyon']] 


Notez qu’à partir du moment où on souhaite effectuer une sélection sur des lignes, il faut utiliser loc (ou iloc si on utilise 


les indices). 


Sélection par condition 


Remémorons-nous d’abord le contenu du dataframe df : 


>>> df 

Paris Lyon 
chat 10 11 
singe 20 21 
souris 30 31 


Sélectionnons maintenant toutes les lignes pour lesquelles les effectifs à Pau sont supérieurs à 15 : 


>>> df[ df["Pau"]>15 ] 


Paris Lyon 
singe 20 21 
souris 30 31 


De cette sélection, on ne souhaite garder que les valeurs pour Lyon : 


Nantes 
22 
32 


Pau 
13 
23 
33 


Pau 
23 
33 


>>> df[ df["Pau"]>15 ]["Lyon"] 


singe 21 
souris 31 
Name: Lyon, dtype: 


On peut aussi combiner plusieurs conditions avec & pour l’ opérateur et : 


int64 


>>> dfl (af["Pau"]>15) € (df["Lyon"]>25) ] 


Paris Lyon 
souris 30 31 


Nantes 
32 


et | pour l’opérateur ou : 


Pau 
33 


>>> df[ (df["Pau"]>15) | (df["Lyon"]>25) ] 


Paris Lyon 
singe 20 21 
souris 30 31 


Nantes 
22 
32 


Pau 
23 
33 
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17.4.5 Combinaison de dataframes 


En biologie, on a souvent besoin de combiner deux tableaux de chiffres à partir d’une colonne commune. 
Par exemple, si on considère les deux dataframes suivants : 


>>> datat = {"Lyon": [10, 23, 17], "Paris": [3, 15, 20]} 
>>> dfi = pd.DataFrame.from_dict(datai) 


>>> dfi.index = ["chat", "singe", "souris"] 
>>> df1 
Lyon Paris 
chat 10 
singe 23 15 
souris 17 20 
et 


>>> data2 = {"Nantes": [3, 9, 14], "Strasbourg": [5, 10, 8]} 
>>> df2 = pd.DataFrame.from_dict (data2) 


>>> df2.index = ["chat", "souris", "lapin"] 
>>> df2 
Nantes Strasbourg 
chat 3 5 
souris 9 10 
lapin 14 8 


On souhaite combiner ces deux dataframes, c’est-à-dire connaître pour les 4 villes (Lyon, Paris, Nantes et Strasbourg) le 
nombre d’ animaux. On remarque d’ores et déjà qu'il y a des singes à Lyon et Paris mais pas de lapin et qu'il y a des lapins à 
Nantes et Strasbourg mais pas de singe. Nous allons voir comment gérer cette situation. 

pandas propose pour cela la fonction concat () * qui prend comme argument une liste de dataframes : 


>>> pd.concat([df1, df2]) 
Lyon Nantes Paris Strasbourg 


chat 10.0 NaN 3.0 NaN 
singe 23.0 NaN 15.0 NaN 
souris 17.0 NaN 20.0 NaN 
chat NaN 3.0 NaN 5.0 
souris NaN 9.0 NaN 10.0 
lapin NaN 14.0 NaN 8.0 


Ici, NaN indique des valeurs manquantes. Mais le résultat obtenu n’est pas celui que nous attendions puisque les lignes de 
deux dataframes ont été recopiées. 
L'argument supplémentaire axis=1 produit le résultat attendu : 


>>> pd.concat([df1, df2], axis=1) 
Lyon Paris Nantes Strasbourg 


chat 10.0 3.0 3.0 5.0 
lapin NaN NaN 14.0 8.0 
singe 23.0 15.0 NaN NaN 
souris 17.0 20.0 9.0 10.0 


Par défaut, pandas va conserver le plus de lignes possible. Si on ne souhaite conserver que les lignes communes aux deux 
dataframes, il faut ajouter l’ argument join="inner" : 


>>> pd.concat([df1, df2], axis=1, join="inner") 
Lyon Paris Nantes Strasbourg 
chat 10 3 3 5 
souris 17 20 9 10 
Un autre comportement par défaut de concat() est que cette fonction va combiner les dataframes en se basant sur leurs 
index. Il est néanmoins possible de préciser, pour chaque dataframe, le nom de la colonne qui sera utilisée comme référence 
avec l’argument join_axes. 


17.5 Un exemple plus complet 


Pour illustrer les possibilités de pandas, voici un exemple plus complet. 

Le fichier transferrin_report.csv que vous pouvez télécharger ici 
rine *?. Cette protéine est responsable du transport du fer dans l’organisme. 

Si vous n’étes pas familier avec le format de fichier . csv, nous vous conseillons de consulter l’annexe A Quelques formats 
de données rencontrés en biologie. 

Voyons maintenant comment explorer les données contenues dans ce fichier avec pandas. 


3! contient une liste de structures de la transfer- 


30. https://pandas.pydata.org/pandas-docs/stable/merging.html 
31. https://python.sdv.univ-paris-diderot.fr/data-files/transferrin_report.csv 
32. https://fr.wikipedia.org/wiki/Transferrine 
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17.5.1 Prise de contact avec le jeu de données 


Une fonctionnalité très intéressante de pandas est d'ouvrir très facilement un fichier au format . csv : 
>>> df = pd.read_csv("transferrin_report.csv") 
Le contenu est chargé sous la forme d’un dataframe dans la variable df. 


Le fichier contient 41 lignes de données plus une ligne d’en-tête. Cette dernière est automatiquement utilisée par pandas 
pour nommer les différentes colonnes. Voici un aperçu des premières lignes : 


>>> df.head() 


PDB ID Source Deposit Date Length MW 
0 1A8E Homo sapiens 1998-03-24 329 36408.4 
1 1A8F Homo sapiens 1998-03-25 329 36408.4 
2 1AIV Gallus gallus 1997-04-28 686 75929.0 
3 1A0V Anas platyrhynchos 1996-12-11 686 75731.8 
4 1B3E Homo sapiens 1998-12-09 330 36505.5 


Nous avons 5 colonnes de données : 

— l'identifiant de la structure (PDB ID); 

— l’organisme d’où provient cette protéine (Source); 

— la date à laquelle cette structure a été déposée dans la Protein Data Bank (Deposit Date); 

— le nombre d’acides aminés qui constituent la protéine (Length); 

— et la masse molaire de la protéine (MW). 

La colonne d’entiers tout à gauche est un index automatiquement créé par pandas. 

Nous pouvons demander à pandas d’utiliser une colonne particulière comme index. La colonne PDB ID s’y prête très bien 
car cette colonne ne contient que des identifiants uniques : 


>>> df = pd.read_csv("transferrin_report.csv", index_col="PDB ID") 
>>> df.head() 
Source Deposit Date Length MW 
PDB ID 
1A8E Homo sapiens 1998-03-24 329 36408.4 
1A8F Homo sapiens 1998-03-25 329 36408.4 
1AIV Gallus gallus 1997-04-28 686 75929.0 
1A0V Anas platyrhynchos 1996-12-11 686 75731.8 
1B3E Homo sapiens 1998-12-09 330 36505.5 


Avant d’analyser un jeu de données, il est intéressant de l’explorer un peu. Par exemple, connaître ses dimensions : 
>>> df.shape 
(41, 4) 


Notre jeu de données contient donc 41 lignes et 4 colonnes. En effet, la colonne PDB ID est maintenant utilisée comme 
index et n’est donc plus prise en compte. 
Il est aussi intéressant de savoir de quel type de données est constituée chaque colonne : 


>>> df.dtypes 


Source object 
Deposit Date object 
Length int64 
MW float64 


dtype: object 


Les colonnes Length et MW contiennent des valeurs numériques, respectivement des entiers (int64) et des floats (float64). 
Le type object est un type par défaut. 

La méthode .info() permet d’aller un peu plus loin dans l’exploration du jeu de données en combinant les informations 
produites par les propriétés . shape et .dtypes : 


>>> df.info() 

<class 'pandas.core.frame.DataFrame '> 
Index: 41 entries, 1A8E to 6CTC 

Data columns (total 4 columns): 


# Column Non-Null Count Dtype 

0 Source 41 non-null object 
1 Deposit Date 41 non-null object 
2 Length 41 non-null int64 

3 MW 41 non-null float64 


dtypes: float64(1), int64(1), object (2) 
memory usage: 1.6+ KB 


Avec l’argument memory_usage="deep", cette méthode permet surtout de connaitre avec précision la taille de l’espace 
mémoire occupé par le dataframe : 
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>>> df.info(memory_usage="deep") 
<class 'pandas.core.frame.DataFrame '> 
Index: 41 entries, 1A8E to 6CTC 

Data columns (total 4 columns): 


# Column Non-Null Count Dtype 

0 Source 41 non-null object 
1 Deposit Date 41 non-null object 
2 Length 41 non-null int64 

3 MW 41 non-null float64 


dtypes: float64(1), int64(1), object (2) 
memory usage: 8.6 KB 


Ici, le dataframe occupe 8,6 ko en mémoire. 


17.5.2 Conversion en date 


Le type object correspond la plupart du temps à des chaînes de caractères. C’est tout à fait légitime pour la colonne 
Source. Mais on sait par contre que la colonne Deposit Date est une date sous la forme année-mois-jour. 

Si le format de date utilisé est homogène sur tout le jeu de données et non ambigu, pandas va se débrouiller pour trouver 
automatiquement le format de date utilisé. On peut alors explicitement demander à pandas de considérer la colonne Deposit 
Date comme une date : 

>>> df["Deposit Date"] = pd.to_datetime(df["Deposit Date"]) 


L'affichage des données n’est pas modifié : 


>>> df.head() 


Source Deposit Date Length MW 
PDB ID 
1A8E Homo sapiens 1998-03-24 329 36408.4 
1A8F Homo sapiens 1998-03-25 329 36408.4 
1AIV Gallus gallus 1997-04-28 686 75929.0 
1A0V Anas platyrhynchos 1996-12-11 686 75731.8 
1B3E Homo sapiens 1998-12-09 330 36505.5 


Mais le type de données de la colonne Deposit Date est maintenant une date (datetime64[ns]) : 


>>> df.dtypes 


Source object 
Deposit Date datetime64 [ns] 
Length int64 
MW float64 


dtype: object 


17.5.3 Statistiques descriptives et table de comptage 


Pour les colonnes qui contiennent des données numériques, on peut obtenir rapidement quelques statistiques descriptives 
avec la méthode .describe() : 


>>> df.describe() 


Length MW 
count 41.000000 41.000000 
mean 477.341463 52816.090244 
std 175.710217 19486.594012 
min 304.000000 33548.100000 
25% 331.000000 36542.300000 
50% 337.000000 37229.300000 
75% 679.000000 75298.500000 
max 696.000000 77067.900000 


On apprend ainsi que la masse moléculaire (colonne MW) a une valeur moyenne de 52816.090244 avec un écart-type de 
19486.594012 et que la plus petite valeur est 33548.100000 et la plus grande 77067.900000. Pratique ! 

La colonne Source contient des chaînes de caractères, on peut rapidement déterminer le nombre de protéines pour chaque 
organisme : 


>>> df["Source"].value _counts() 


Homo sapiens 26 
Gallus gallus 10 
Anas platyrhynchos 2 
Oryctolagus cuniculus 2 
Sus scrofa 1 


Name: Source, dtype: int64 


Ainsi, 26 protéines sont d’origine humaine (Homo sapiens) et 10 proviennent de la poule (Gallus gallus). 
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17.5.4 Statistiques par groupe 


On peut aussi déterminer, pour chaque organisme, la taille et la masse moléculaire moyennes des transferrines : 


>>> df.groupby (["Source"]).mean() 


Length MW 
Source 
Anas platyrhynchos 686.000000 75731.800000 
Gallus gallus 509.300000 56324.080000 
Homo sapiens 439.615385 48663.392308 
Oryctolagus cuniculus 490.000000 54219.600000 
Sus scrofa 696.000000 77067.900000 


La méthode . groupby() rassemble d’abord les données suivant la colonne Source puis la méthode .mean() calcule la 
moyenne pour chaque groupe. 

Si on souhaite obtenir deux statistiques (par exemple la valeur minimale et maximale) en une seule fois, il convient alors 
d’utiliser la méthode .pivot_table() plus complexe mais aussi beaucoup plus puissante : 


>>> df.pivot_table(index="Source", values=["Length", "MW"], aggfunc=[min, max]) 
min max 
Length MW Length MW 
Source 
Anas platyrhynchos 686 75731.8 686 75731.8 
Gallus gallus 328 36105.8 686 75957.1 
Homo sapiens 327 36214.2 691 76250.2 
Oryctolagus cuniculus 304 33548.1 676 74891.1 
Sus scrofa 696 77067.9 696 77067.9 


L’argument index précise la colonne dont on agrège les données. 

L’argument values indique sur quelles colonnes les statistiques sont calculées. 

Enfin, aggfunc liste les statistiques calculées, ici la valeur minimale et maximale. 

Notez que les valeurs renvoyées sont d’abord les valeurs minimales pour Length et MW puis les valeurs maximales pour 
Length et MW. 


17.5.5 Analyse de données numériques 


On peut, sans trop de risque, émettre l’hypothèse que plus il y a d’acides aminés dans la protéine, plus sa masse moléculaire 
va être élevée. 
Pour vérifier cela graphiquement, on représente la masse moléculaire de la protéine en fonction de sa taille (c’est-à-dire 
du nombre d’acides aminés). 
>>> import matplotlib.pyplot as plt 
>>> plt.scatter(df["Length"], df["MW"]) 


<matplotlib.collections.PathCollection object at 0x7f62c2501780> 
>>> plt.xlabel("Taille (nombre d'acides aminés)") 


Text (0.5, 0, "Taille (nombre d'acides aminés)") 
>>> plt.ylabel("Masse moléculaire (Dalton)") 
Text(0, 0.5, 'Masse moléculaire (Dalton)') 


>>> plt.savefig("transferrinei.png") 


On obtient un graphique similaire a celui de la figure 17.6 (A) avec deux groupes de points distincts (car certaines structures 
sont incomplètes). 
On peut zoomer sur le groupe de points le plus à gauche en ne sélectionnant que les protéines constituées de moins de 400 
résidus : 
>>> dfz = df[df["Length"]<400] 


Puis en créant un deuxième graphique : 


>>> plt.clf() 

>>> plt.scatter(dfz["Length"], dfz["MW"]) 
<matplotlib.collections.PathCollection object at 0x7f85bb4852e8> 
>>> plt.xlabel("Taille (nombre d'acides aminés)") 


Text (0.5, 0, "Taille (nombre d'acides aminés)") 
>>> plt.ylabel("Masse moléculaire (Dalton)") 
Text(0, 0.5, 'Masse moléculaire (Dalton)') 


>>> plt.savefig("transferrine2.png") 


Ligne 1. L’instruction p1t.c1f () efface le graphe précédent mais conserve les noms des axes des abscisses et des ordon- 
nées. 


Le graphique 17.6 (B) obtenu met en évidence une relation linéaire entre le nombre de résidus d'une protéine et sa masse 
moléculaire. 
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FIGURE 17.6 — (A) Masse moléculaire en fonction de la taille. (B) Zoom. 
En réalisant une régression linéaire, on détermine les paramétres de la droite qui passent le plus proche possible des points 
du graphique. 


>>> from scipy.stats import linregress 

>>> lr = linregress(dfz["Length"], díz["MW"]) 

>>> lr 

LinregressResult (slope=116.18244897959184, intercept=-1871.6131972789153, 
rvalue=0.993825553885062, pvalue=1.664932379936294e-22, 
stderr=2.765423239336685) 


Ce modèle linaire nous indique qu’un résidu a une masse d’environ 116 Dalton, ce qui est cohérent. On peut également 


comparer ce modèle aux différentes protéines : 


>>> plt.clf() 


>>> plt.scatter(dfz["Length"], dfz["MW"]) 
<matplotlib.collections.PathCollection object at 0x7f85b97bfef0> 


>>> plt.plot(dfz["Length"], dfz["Length"]*lr.slopetlr.intercept, ls=":") 
[<matplotlib.lines.Line2D object at 0x7f85b933e208>] 
>>> plt.xlabel("Taille (nombre d'acides aminés)") 


Text(0.5, 0, "Taille (nombre d'acides aminés)") 
>>> plt.ylabel("Masse moléculaire (Dalton)") 
Text(0, 0.5, 'Masse moléculaire (Dalton)') 


>>> plt.savefig("transferrine3.png") 


On obtient ainsi le graphique de la figure 17.7. 


17.5.6 Analyse de données temporelles 


Il peut être intéressant de savoir, pour chaque organisme, quand les premières et les dernières structures de transferrines 


ont été déposées dans la PDB. 


La méthode .pivot_table() apporte un élément de réponse : 


>>> df.pivot_table(index="Source", values=["Deposit Date"], aggfunc=[min, max]) 
min max 
Deposit Date Deposit Date 
Source 
Anas platyrhynchos 1995-08-03 1996-12-11 
Gallus gallus 1993-09-15 2005-09-28 
Homo sapiens 1992-02-10 2018-03-22 
Oryctolagus cuniculus 1990-08-16 2001-07-24 
Sus scrofa 2001-07-03 2001-07-03 


Chez l'Homme (Homo sapiens), la première structure de transferrine a été déposée dans la PDB le 10 février 1992 et la 


dernière le 22 mars 2018. 


Une autre question est de savoir combien de structures de transferrines ont été déposées en fonction du temps. 
La méthode .value_counts () peut être utilisée mais elle ne renvoie que le nombre de structures déposées dans la PDB 


pour un jour donné. Par exemple, deux structures ont été déposées le 4 septembre 2000. 
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FIGURE 17.7 — Masse moléculaire en fonction de la taille (zoom) avec un modèle linaire. 


>>> df["Deposit Date"].value_counts().head() 


1999-01-07 2 
2000-09-04 2 
2002-11-18 2 
2003-03-10 1 
2001-07-24 1 


Name: Deposit Date, dtype: int64 


Si on souhaite une réponse plus globale, par exemple, à l’ échelle de l’année, la méthode . resample () calcule le nombre 
de structures déposées par année (en fournissant l’argument A) : 


>>> df["Deposit Date"].value_counts().resample("A"). count () 


1990-12-31 1 
1991-12-31 0 
1992-12-31 1 
1993-12-31 1 


Les dates apparaissent maintenant comme le dernier jour de l’année mais désignent bien l’année complète. Dans cet 
exemple, une seule structure de transferrine a été déposée dans la PDB entre le ler janvier 1990 et le 31 décembre 1990. 

Pour connaitre en quelle année le plus de structures ont été déposées dans la PDB, il faut trier les valeurs obtenus du plus 
grand au plus petit avec la méthode .sort_values(). Comme on ne veut connaître que les premières dates (celles où il y a 
eu le plus de dépôts), on utilisera également la méthode .head() : 


>>> (df ["Deposit Date"].value_counts () 
.resample ("A") 


. count () 
.sort_values(ascending=False) 

ee . head ()) 

2001-12-31 5 

2003-12-31 4 

1998-12-31 3 

1999-12-31 3 

2002-12-31 3 


Name: Deposit Date, dtype: int64 


En 2001, cinq structures de transferrine ont été déposées dans la PDB. La deuxiéme « meilleure » année est 2003 avec 
quatre structures. 

Toutes ces méthodes, enchainées les unes à la suite des autres, peuvent vous sembler complexes mais chacune d’elles 
correspond à une étape particulière du traitement des données. L'utilisation des parenthèses (ligne 1, juste avant df ["Deposit 
Date"] et ligne 5, juste après head () ) permet de répartir élégamment cette longue instruction sur plusieurs lignes. 

Bien sûr, on aurait pu créer des variables intermédiaires pour chaque étape mais cela aurait été plus lourd : 


>>> datei = df["Deposit Date"].value_counts() 
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>>> date2 datei.resample ("A") 
>>> date3 count () 
>>> date4 date3.sort_values (ascending=False) 


>>> date4.head() 
5 


non ou 
a 
w 
ct 
o 
N 


2001-12-31 

2003-12-31 4 
1998-12-31 3 
1999-12-31 3 
2002-12-31 3 


Name: Deposit Date, dtype: int64 


Pour aller plus loin 
— Les ouvrages Python for Data Analysis de Wes McKinney et Pandas Cookbook de Theodore Petrou sont d’excellentes 
références pour pandas. 


17.6 Exercices 


La barstar est un inhibiteur de ribonucléase. C’est une protéine relativement simple qui contient 89 acides aminés. Sa 
structure tridimensionnelle, obtenue par cristallographie aux rayons X, se trouve dans la Protein Data Bank (PDB) sous le 
code 1BTA. 


17.6.1 Distance entre deux atomes carbones alpha consécutifs de la barstar 

L'objectif de cet exercice est de calculer la distance entre carbones alpha consécutifs le long de la chaîne peptidique avec 
module NumPy. 
Extraction des coordonnées atomiques 


Téléchargez le fichier 1bta.pdb qui correspond à la structure de la barstar *? sur le site de la PDB (lien direct vers le 
fichier **). 
Voici le code pour extraire les coordonnées atomiques des carbones alpha de la barstar : 


with open("1bta.pdb", "r") as f_pdb, open("1bta_CA.txt", "w") as f_CA: 
for ligne in f_pdb: 
if ligne.startswith("ATOM") and ligne[12:16].strip() == "CA": 


ligne [30:38] 
ligne [38:46] 
ligne [46:54] 
_CA.write(f"{x} {y} {z} ") 


h NS 


Ligne 1. On ouvre deux fichiers simultanément. Ici, le fichier 1bta . pdb est ouvert en lecture (r) et le fichier 1bta_CA.txt 
est ouvert en écriture (w). 

Pour chaque ligne du fichier PDB (ligne 2), si la ligne débute par ATOM et le nom de l’atome est CA (ligne 3), alors on 
extrait les coordonnées atomiques (lignes 4 à 6) et on les écrit dans le fichier 1bta_CA.txt (ligne 7). Les coordonnées sont 
toutes enregistrées sur une seule ligne, les unes après les autres. 


Lecture des coordonnées 


Ouvrez le fichier 1bta_CA.txt avec Python et créez une liste contenant toutes les coordonnées sous forme de floats avec 
les fonctions split () et float(). 
Affichez à l’écran le nombre total de coordonnées. 


Construction de la matrice de coordonnées 


En ouvrant dans un éditeur de texte le fichier 1bta.pdb, trouvez le nombre d’acides aminés qui constituent la barstar. 

Avec la fonction array() du module NumPy, convertissez la liste de coordonnées en array. Avec la fonction reshape () 
de NumPy, construisez ensuite une matrice à deux dimensions contenant les coordonnées des carbones alpha de la barstar. 
Affichez les dimensions de cette matrice. 


33. http://www.rcsb.org/pdb/explore.do?structureld=1BTA 
34. https://files.rcsb.org/download/1BTA.pdb 


Cours de Python / Université de Paris / UFR Sciences du Vivant 


165 


Chapitre 17. Quelques modules d’intérêt en bioinformatique 17.6. Exercices 


Calcul de la distance 


Créez maintenant une matrice qui contient les coordonnées des n — 1 premiers carbones alpha et une autre qui contient les 
coordonnées des n — 1 derniers carbones alpha. Affichez les dimensions des matrices pour vérification. 

En utilisant les opérateurs mathématiques habituels (-, +, **2) et les fonctions sqrt() et sum() du module NumPy, 
calculez la distance entre les atomes n et n+ 1. 

Pour chaque atome, affichez le numéro de l’atome et la distance entre carbones alpha consécutifs avec un chiffres après la 
virgule. Repérez la valeur surprenante. 


17.6.2 Jour le plus chaud 


Le fichier temperature. dat *> contient un relevé de 4 températures pour chaque jour de la semaine : 


Lun 12 11 14 12 
Mar 12 10 14 11 
Mer 11 11 14 13 


Decl 


À l’aide du module NumPy, on souhaite déterminer quel est le jour de la semaine le plus chaud. Pour cela nous vous 
proposons les étapes suivantes : 


1. Récupérez le nom des jours de la semaine depuis le fichier et mettez-les dans une liste days. 


2. Récupérez les valeurs de températures depuis le fichier et mettez-les dans un array 2D. La fonction np .1oadtxt () *° 
et son argument usecols vous seront utiles. 


3. Parcourez chaque ligne de la matrice, calculez la température moyenne de chaque jour puis stockez-la dans une liste 
mean_temps. 


4. À l’aide des deux listes days et mean_temps, déterminez et affichez le jour le plus chaud. 


17.6.3 Calcul du centre de masse d’une membrane 


L'image de gauche de la figure 17.8 montre le cliché d’une membrane de POPC (cyan) entourée d’eau (bleu) (coordonnées 
trouvées ici *”). Les atomes de phosphore des groupes phosphates sont représentés en boule de van der Waals brune. Dans cet 
exercice on cherche a calculer le centre de masse de la membrane, ainsi que le centre de masse (COM) de chaque monocouche 
de phosphores. Ces COM sont représentés sous forme de croix dans l’image de droite de la figure 17.8. 

Les coordonnées cartésiennes (x,y,z) de chaque phosphore (en A) sont stockées dans le fichier coors_P.dat **, à raison 
d’un atome par ligne. Nous vous proposons les étapes suivantes pour résoudre cet exercice à l’aide du module NumPy : 

— Récupérez les coordonnées des atomes de phosphore depuis le fichier coors_P.dat et stockez-les dans un array 2D 

(matrice) coors_P. La dimensionnalité de cette matrice est n x 3, avec n le nombre de phosphores. 

— Calculez le z moyen de tous les phosphores (nombre réel) et stockez-le dans la variable mean_z. La méthode .mean () 

vous sera utile. 

— Avec des masques de booléens, récupérez les coordonnées des phosphores de la monocouche du haut dans un array 

2D upper. Faites de même avec la monocouche du bas dans un array 2D lower. 

— Calculez le centre de masse COM de la membrane, ainsi que de la monocouche du haut COM_upper et du bas COM_lower. 

Pensez aux méthodes de calcul sur les arrays et argument axis. 

— Une fois tout cela effectué, créez un graphique 3D pour représenter les différents centres de masse. Vous pourrez 

utiliser la fonction scatter () du module matplotlib. Pour l'affichage en 3D °°, voici un squelette de programme : 


# Init plot. 

from mpl_toolkits.mplot3d import Axes3D 
import matplotlib.pyplot as plt 

fig = plt.figure() 

ax = fig.add_subplot(111, projection='3d') 


Legal 

# X, Y et Z sont des arrays 1D de n éléments (par exemple X représente tous les x des P de la monocouche up 
ax.scatter(X, Y, Z, c="salmon", marker="0") 

# x, y, z sont des floats avec les coordonnées du COM de la upper. 

ax.scatter(x, y, z, c="red", marker="x") 


35. https://python.sdv.univ-paris-diderot.fr/data-files/temperatures.dat 
36. https://numpy.org/doc/stable/reference/generated/numpy.loadtxt.html 
37. https://zenodo.org/record/153944 

38. https://python.sdv.univ-paris-diderot.fr/data-files/coors_P.dat 

39. https://matplotlib.org/3.2.1/gallery/mplot3d/scatter3d.html 
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Graphe 3D des phosphores 
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FIGURE 17.8 — Cliché d’une membrane de POPC. 


Lses] 
# Axis + title. 


ax.set_xlabel("x (A)") 
ax.set_ylabel("y (A)") 


ax.set_zlabel("z (A)") 
ax.set_title("Graphe 3D des phosphores") 


plt.show() 


17.6.4 Années de publication des articles relatifs à la barstar 


L'objectif de cet exercice est d’interroger automatiquement la base de données bibliographique PubMed pour déterminer 


le nombre d’ articles relatifs à la barstar publiés chaque année. 
Vous utiliserez les modules Biopython et matplotlib. 


Requéte avec un mot-clé 


Sur le site de PubMed *, cherchez combien d’ articles scientifiques sont relatifs à la barstar. 

Effectuez la méme chose avec Python et la méthode Entrez.esearch() de Biopython. 

Choisissez un des PMID renvoyé et vérifiez dans PubMed que l’article associé est bien à propos de la barstar. Pour cela, 
indiquez le PMID choisi dans la barre de recherche de PubMed et cliquez sur Search. Attention, l' association n’est pas toujours 


évidente. Cherchez éventuellement dans le résumé de l’article si besoin. 
Est-ce que le nombre total d’ articles trouvés est cohérent avec celui obtenu sur le site de PubMed ? 


Récupération des informations d’une publication 


Récupérez les informations de la publication dont le PMID est 29701945 “!. Vous utiliserez la méthode Entrez .esummary (). 


40. https://www.ncbi.nlm.nih.gov/pubmed/ 
41. https://www.ncbi.nlm.nih.gov/pubmed/29701945 
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Affichez le titre, le DOI, le nom du journal (Source) et la date de publication (PubDate) de cet article. Vérifiez que cela 
correspond bien à ce que vous avez lu sur PubMed. 


Récupération du résumé d’une publication 


Récupérez le résumé de la publication dont le PMID est 29701945. Vous utiliserez la méthode Entrez .efetch(). 
Affichez ce résumé. Combien de caractères contient-il ? 


Distribution des années de publication des articles relatifs à la barstar 


En utilisant la méthode Entrez.esearch(), récupérez tous les PMID relatifs à la barstar. Pour cela, pensez à augmenter 
le paramètre retmax. Vos PMID seront stockés dans la liste pmids sous forme de chaînes de caractères. Vérifiez sur PubMed 
que vous avez bien récupéré le bon nombre d’articles. 

En utilisant maintenant la méthode Entrez .esummary() dans une boucle, récupérez la date de publication de chaque 
article. Stockez l’année sous forme d’un nombre entier dans la liste years. Cette étape peut prendre une dizaine de minutes, 
soyez patient. Vous pouvez dans votre boucle afficher un message qui indique où vous en êtes dans la récupération des articles. 

À la fin vérifiez que votre liste years contient bien autant d'éléments que la liste pmids. 

Calculez maintenant le nombre de publications par année. Vous créerez pour cela un dictionnaire freq qui aura pour clé 
les années (oui, une clé de dictionnaire peut aussi être un entier) et pour valeur le nombre de publications associées à une 
année donnée. 

Créez une liste x qui contient les clés du dictionnaire freq. Ordonnez les valeurs dans x avec la méthode .sort(). 
Créez maintenant une seconde liste y qui contient, dans l’ordre, le nombre de publications associées à chaque années. Bien 
évidemment, les listes x et y doivent avoir la même taille. Au fait, en quelle année la barstar apparaît pour la première fois 
dans une publication scientifique ? 

Ensuite, avec le module matplotlib, vous allez pouvoir afficher la distribution des publications en fonction des années : 


import matplotlib.pyplot as plt 
plt.bar(x, y) 
plt.show() 


Vous pouvez également ajouter un peu de cosmétique et enregistrer le graphique sur votre disque dur : 
import matplotlib.pyplot as plt 
plt.bar(x, y) 


# redéfinition des valeurs affichées sur l'axe des ordonnées 
plt.yticks(list(range(0, max(y), 2))) 


# étiquetage des axes et du graphique 

plt.xlabel ("Années") 

plt.ylabel("Nombre de publications") 

plt.title("Distribution des publications qui mentionnent la barstar") 


# enregistrement sur le disque 
plt.savefig("distribution_barstar_annee.png", bbox_inches='tight', dpi=200) 


17.6.5 Analyse d’un jeu de données avec pandas 


Le jeu de données people.tsv contient les caractéristiques de quelques individus : prénom, sexe, taille (en cm) et age 
(en années). Par exemple : 


name Sex size age 


simon male 175 33 
clara female 167 45 
serge male 181 44 
claire female 174 31 


L'objectif de cet exercice est de manipuler ces données avec pandas. 
Si vous n’étes pas familier avec le format de fichier .tsv, nous vous conseillons de consulter annexe A Quelques formats 
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de données rencontrés en biologie. 


Chargement du jeu de données 


Téléchargez le fichier people.tsv *. 

Ouvrez ce fichier avec pandas et la fonction .read_csv(). N’oubliez pas de préciser le séparateur par défaut avec l’ar- 
gument sep="\t". Utilisez également l’argument index_col pour utiliser la colonne name comme index. 

Affichez les 6 premières lignes du jeu de données. 

Combien de lignes contient le jeu de données ? 


Sélections 
Déterminez la taille de Claire. 
Déterminez l’âge de Baptiste. 
Affichez, en une seule commande, l’âge de Paul et Bob. 
Statistiques descriptives et table de comptage 
Déterminez la moyenne et la valeur minimale de la taille et l’âge des individus. 
Comptez ensuite le nombre de personnes de chaque sexe. 
Statistiques par groupe 


Déterminez, la taille et l’âge moyen chez les hommes et les femmes. Utilisez pour cela la méthode .groupby(). 


Sélections par filtre 
Déterminez combien de d’individus mesurent plus de 1,80 m. 
Quelle femme a moins de 35 ans ? 

Sélections et statistiques 


Déterminez l’âge moyen des individus qui mesurent plus de 1,80 m. 
Déterminez la taille maximale des femmes qui ont plus de 35 ans. 


42. https://python.sdv.univ-paris-diderot.fr/data-files/people.tsv 
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Chapitre 18 


Jupyter et ses notebooks 


Les notebooks Jupyter sont des cahiers électroniques qui, dans le même document, peuvent rassembler du texte, des 
images, des formules mathématiques et du code informatique exécutable. Ils sont manipulables interactivement dans un navi- 
gateur web. 

Initialement développés pour les langages de programmation Julia, Python et R (d’où le nom Jupyter), les notebooks 
Jupyter supportent près de 40 langages différents. 

La cellule est l’élément de base d’un notebook Jupyter. Elle peut contenir du texte formaté au format Markdown ou du 
code informatique qui pourra être exécuté. 

Voici un exemple de notebook Jupyter (figure 18.1) : 

Ce notebook est constitué de cinq cellules : deux avec du texte en Markdown (la première et la dernière) et trois avec du 
code Python (notées avec In [ ]). 


18.1 Installation 


Avec la distribution Miniconda, les notebooks Jupyter s’installent avec la commande : 


$ conda install -y jupyterlab 


Pour être exact, la commande précédente installe un peu plus que les notebooks Jupyter mais nous verrons cela par la 
suite. 


18.2 Lancement de Jupyter et création d’un notebook 


Pour lancer les notebooks Jupyter, utilisez la commande suivante depuis un shell : 


$ jupyter -notebook 


Une nouvelle page devrait s’ouvrir dans votre navigateur web et ressembler à la figure 18.2. 

Cette interface liste les notebooks Jupyter existants (pour le moment aucun). 

Pour créer un notebook, cliquez sur le bouton à droite New puis sélectionnez Python 3. Vous noterez au passage qu’il est 
également possible de créer un fichier texte, un répertoire ou bien encore de lancer un shell via un Terminal (voir figure 18.3). 

Le notebook fraîchement créé ne contient qu’une cellule vide. 

La première chose à faire est de donner un nom à votre notebook en cliquant sur Untitled, à droite du logo de Jupyter. Si 
le nom de votre notebook est test alors le fichier test.ipynb sera créé dans le répertoire depuis lequel vous avez lancé Jupyter. 


Remarque 
L'extension .ipynb est l’extension de fichier des notebooks Jupyter. 


Vous pouvez entrer des instructions Python dans la première cellule. Par exemple : 
a = 2 
b = 3 

print (a+b) 
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Exemple de notebook Jupyter 
Cette cellule contient du texte formaté en Markdown. 


On peut ajouter du texte en gras ou bien en italique. 


In [1]: # cette cellule contient du code Python 
# qui est exécuté 
© print("Hello Python !") 


Hello Python ! 


In [2]: # une autre cellule avec du code Python 
# mais qui ne renvoie rien 
O def ma_fonction(x): 
return x + 2 


In [3]: # une autre cellule avec du code Python 
* mais qui renvoie quelque chose 
© # même si la fonction print() n'est pas utilisé 
# ce comportement ressemble à celui de l'interpréteur Python 
ma_fonction(3) 


Out[3]: 5 


© Encore du texte 


avec une équation : 


FIGURE 18.1 — Exemple de notebook Jupyter. Les chiffres entourés désignent les différentes cellules. 


t 
~ J u pyter Quit Logout 
Files Running Clusters 
Select items to perform actions on them. Upload Newr © 
oly B/ Name y Last Modified File size 


The notebook list Is empty. 


FIGURE 18.2 — Interface de Jupyter. 
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18.2. Lancement de Jupyter et création d’un notebook 


= jupyter 


Files Running Clusters 


Select Items to perform actions on them. 


o~ lm/ 


z ju pyte r Untitled (unsaved changes) 


File Edit View Insert 


Quit Logout 


Upload 2 


Notebook 
Ni ! 
lame y Python 3 e 
The notebook list is empty. 
Other: 
Text File 
Folder 
Terminal 
FIGURE 18.3 — Création d’un nouveau notebook. 
À. Logout 
Cell Kernel Widgets Help Trusted 4 |Python3 O 
M Run E C D Code J E 


Bit x 4 4 + 


In[ ]: | 


172 


FIGURE 18.4 — Nouveau notebook. 
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de jupyter test (autosavea) e Logout 
File Edit View Insert Cell Kernel Widgets Help Trusted | Python 3 O 
D + x & BR 4 4) ARN MC» code Je 
In [1]: a=2 
b=3 


print(a + b) 
5 


FIGURE 18.5 — Exécution d'une première cellule. 


Pour exécuter le contenu de cette cellule, vous avez plusieurs possibilités : 

— Cliquer sur le menu Cell, puis Run Cells. 

— Cliquer sur le bouton Run (sous la barre de menu). 

— Presser simultanément les touches Ctrl + Entrée. 

Dans tous les cas, vous devriez obtenir quelque chose qui ressemble à l’image 18.5. La notation In [1] à gauche de la 
cellule indique qu’il s’agit de la première cellule exécutée. 

Pour créer une nouvelle cellule, vous avez, ici encore, plusieurs possibilités : 

— Cliquer sur l’icône + sous la barre de menu. 

— Cliquer sur le menu /nsert, puis Insert Cell Below. 

Une nouvelle cellule vide devrait apparaître. 

Vous pouvez également créer une nouvelle cellule en positionnant votre curseur dans la première cellule, puis en pressant 
simultanément les touches Alt + Entrée. Si vous utilisez cette combinaison de touches, vous remarquerez que le numéro à 
gauche de la première cellule est passée de In [1] à In [2] car vous avez exécuté la première cellule puis créé une nouvelle 
cellule. 

Vous pouvez ainsi créer plusieurs cellules les unes à la suite des autres. Un objet créé dans une cellule antérieure sera 
disponible dans les cellules suivantes. Par exemple, dans la figure 18.6, nous avons quatre cellules. Vous remarquerez que 
pour les cellules 3 et 4, le résultat renvoyé par le code Python est précédé par Out [3] et Out [4]. 

Dans un notebook Jupyter, il est parfaitement possible de réexécuter une cellule précédente. Par exemple la première 
cellule, qui porte désormais à sa gauche la numérotation In [5] (voir figure 18.7). 


Attention 
La possibilité d’exécuter les cellules d’un notebook Jupyter dans un ordre arbitraire peut prêter à confusion, notamment si 
vous modifiez la même variable d’une cellule à l’autre. 
Nous vous recommandons de régulièrement relancer complètement l’exécution de toutes les cellules de votre notebook, 
de la première à la dernière, en cliquant sur le menu Kernel puis Restart & Run All et enfin de valider le message Restart and 
Run All Cells. 


18.3 Le format Markdown 


Dans le tout premier exemple (figure 18.1), nous avons vu qu’il était possible de mettre du texte au format Markdown dans 
une cellule. 

Il faut cependant indiquer à Jupyter que cette cellule est au format Markdown en cliquant sur Code sous la barre de menu 
puis en choisissant Markdown. 

Le format Markdown permet de rédiger du texte formaté (gras, italique, liens, titres, images, formules mathématiques...) 
avec quelques balises trés simples. Voici un exemple dans une notebook Jupyter (figure 18.8) et le rendu lorsque la cellule est 
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2 J u pyter test (unsaved changes) 


File Edit View Insert Cell Kernel Widgets 


A + xR 4 + MRun M CPW Code 


In [1]: a=2 
b=3 
print(a + b) 
5 


In [2]: def ma fonction(x, y): 
return x + y 


In [3]: ma fonction(a, 10) 
Out[3]: 12 


In [4]: ma_fonction("Bonjour", "Jupyter") 


Out[4]: 'BonjourJupyter' 


Help Trusted 


Jm 


FIGURE 18.6 — Notebook avec plusieurs cellules de code Python. 


z Ju pyter test (autosaved) 


File Edit View Insert Cell Kernel Widgets 


A + * ® BR 4 y MRun E C D Code 


a =2 
b =3 
print(a + b) 


In [5]: 


un 


In [2]: def ma_fonction(x, y): 
return x + y 


In [3]: ma_fonction(a, 10) 


Out[3]: 12 


In [4]: ma_fonction("Bonjour", "Jupyter") 


Out[4]: 'BonjourJupyter' 


Help Trusted 


j= 


FIGURE 18.7 — Notebook avec une cellule ré-exécutée. 
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ee J u pyter test (autosaved) 


A Logout 


File Edit View Insert Cell Kernel Widgets 


Trusted | Python3 O 


+ x aB t & MRun M CD Markdown | E 


# Un premier titre 
Du texte normale, ou en *italique*, ou bien encore en **gras**. 


Un lien hypertexte vers le [cours] (https://python.sdv.univ-paris- 
diderot.fr/). 


## Un titre de second niveau 

Voici le logo de Jupyter : ![Logo de Jupyter](jupyter-logo.png) 
### Un titre de troisième niveau 

Du code informatique : 


def ma fonction(x, y): 
r return X + y 


une liste : 
- premier élément 
- second élément 


FIGURE 18.8 — Notebook avec une cellule au format Markdown. 


exécutée (figure 18.9). 

Notez qu’une cellule Markdown n’a pas le marqueur In [ ] à sa gauche. 

Le format Markdown permet de rapidement et très simplement rédiger du texte structuré. Ce cours est par exemple com- 
plètement rédigé en Markdown ;-) 

Nous vous conseillons d’explorer les possibilités du Markdown en consultant la page Wikipédia | ou directement la page 


de référence ?. 


18.4 Des graphiques dans les notebooks 


Un autre intérêt des notebooks Jupyter est de pouvoir y incorporer des graphiques réalisés avec la bibliothèque matplotlib. 
Voici un exemple en reprenant un graphique présenté dans le chapitre 17 Quelques modules d'intérêt en bioinformatique 
(figure 18.10). 
La différence notable est l’utilisation de la commande : 
/matplotlib inline 
qui n’est à lancer qu’une seule fois (en général dans la première cellule du notebook) et qui permet l’incorporation de figures 
dans un notebook Jupyter. 


Remarque 
Pour quitter l’interface des notebooks Jupyter, il faut, dans le premier onglet qui est apparu, cliquer sur le bouton Quit 
(figure 18.2). 
Une méthode plus radicale est de revenir sur le shell depuis lequel les notebooks Jupyter ont été lancés puis de presser 
deux fois la combinaison de touches Ctrl + C. 


1. https://fr.wikipedia. org/wiki/Markdown 
2. https://daringfireball.net/projects/markdown/syntax 
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TZ Jupyter test urosaves Logout 


File Edt View Inset Cell Kernel Widgets Help Trusted | Python 3 O 


+ © KR # 4 MRun E C D Markdown | 


Un premier titre 
Du texte normale, ou en italique, ou bien encore en gras. 


Un lien hypertexte vers le cours. 


Un titre de second niveau 
Voici le logo de Jupyter : 
aa 
jupyter 
~~ 
Un titre de troisième niveau 
Du code informatique : 


def ma fonction(x, y): 
return x + y 


une liste : 


e premier élément 
e second élément 


FIGURE 18.9 — Notebook avec une cellule au format Markdown (après exécution). 
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ae ju pyter test (autosaved) 


File Edit View Insert Cell Kernel 


B + xB 4 v MRun E C D Code 


In [8]: 


Out[8]: 


Widgets Help Trusted 
| = 


“matplotlib inline 
import numpy as np 
import matplotlib.pyplot as plt 


temps = [1, 2, 3, 4, 6, 7, 9] 
concentration = [5.5, 7.2, 11.8, 13.6, 19.1, 21.7, 29.4] 


plt.scatter(temps, concentration, marker='o', color = 'blue') 


plt.xlabel ("Temps (h)") 
plt.ylabel ("Concentration (mg/L)") 
plt.title("Concentration de produit en fonction du temps") 


x = np.linspace( min(temps), max(temps), 50) 
Y= 2 +3 xXx 
plt.plot(x, y, color='green', ls="--") 


[<matplotlib.lines.Line2D at 0x7f2928591c88>] 


Concentration de produit en fonction du temps 


, 
p 
w 
s 
e 
~ Ed 
a e 
o e 
- 
E PS 
€ 
S ra 
= e 
£ 7 
E "a 
g 6 
3 of 
Š s- 
pe 
- 
e 
"0 
e 
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FIGURE 18.10 — Incorporation d'un graphique dans un notebook Jupyter. 
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In [9]: “whos 


Variable Type Data/Info 

a int 2 

b int 3 

concentration list n=7 

ma fonction function <function ma fonction at 0x7f2950b46048> 

np module <module 'numpy' from '/ho<...>kages/numpy/_ 
init_ .py'> 

plt module <module 'matplotlib.pyplo<...>es/matplotlib 

/pyplot.py'> 

temps list n=7 

x ndarray 50: 50 elems, type ‘float64', 400 bytes 

y ndarray 50: 50 elems, type float64 , 400 bytes 


FIGURE 18.11 — Magic command /whos. 


18.5 Les magic commands 


La commande précédente (Amatplotlib inline) est une magic command. Il en existe beaucoup, en voici deux : 

— whos liste tous les objets (variables, fonctions, modules...) utilisés dans le notebook (voir figure 18.11). 

— history liste toutes les commandes Python lancées dans un notebook (voir figure 18.12). 

Enfin, avec les environnements Linux ou Mac OS X, il est possible de lancer une commande Unix depuis un notebook 
Jupyter. Il faut pour cela précéder la commande du symbole « ! ». La figure 18.13 illustre cette possibilité avec la commande 
1s qui affiche le contenu d’un répertoire. 


Remarque 

Le lancement de n’importe quelle commande Unix depuis un notebook Jupyter (en précédant cette commande de !) est 
une fonctionnalité trés puissante. 

Pour vous en rendre compte, jetez un œil au notebook? produit par les chercheurs Zichen Wang et Avi Ma’ayan qui 
reproduit l’ analyse complète de données obtenues par séquencage haut débit. Ces analyses ont donné lieu à la publication de 
Particle scientifique « An open RNA-Seq data analysis pipeline tutorial with an example of reprocessing data from a recent 
Zika virus study * » (F1000 Research, 2016). 


18.6 JupyterLab 


En 2018, le consortium Jupyter a lancé JupyterLab qui est un environnement complet d’analyse. Pour obtenir cette inter- 
face, lancez la commande suivante depuis un shell : 


$ jupyter lab 


Une nouvelle page devrait s’ouvrir dans votre navigateur web et vous devriez obtenir une interface similaire à la figure 
18.14. 

L'interface proposée par JupyterLab est très riche. On peut y organiser un notebook Jupyter « classique » avec une figure 
en encart, un shell (voir figure 18.15)... Les possibilités sont infinies ! 


Pour aller plus loin 
Les notebooks Jupyter sont particulièrement adaptés à l’analyse de données en combinaison avec les modules matplotlib 
et pandas. 


3. https://github.com/MaayanLab/Zika-RNAseq-Pipeline/blob/master/Zika.ipynb 
4. https://f1000research.com/articles/5-1574/ 
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In [7]: “history 
2 


a 
b 
print(a + b) 
def ma fonction(x, y): 

return x + y 
ma_fonction(a, 10) 
ma_fonction("Bonjour", "Jupyter") 
smatplotlib inline 
import numpy as np 
import matplotlib.pyplot as plt 


temps = [1, 2, 3, 4, 6, 7, 9] 
concentration = [5.5, 7.2, 11.8, 13.6, 19.1, 21.7, 29.4] 


plt.scatter(temps, concentration, marker='0', color = 'blue') 
plt.xlabel ("Temps (h)") 


plt.ylabel ("Concentration (mg/L)") 
plt.title("Concentration de produit en fonction du temps”) 


x = np.linspace( min(temps), max(temps), 50) 
y=2+3*x 

plt.plot(x, y, color='green', ls="--") 
Swhos 

shistory 


FIGURE 18.12 — Magic command history. 


In [12]: | !ls 
jupyter-exemple.ipynb jupyter-logo.png test.ipynb 


FIGURE 18.13 — Lancement d’une commande Unix. 
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+ t 
Ba 


ft 
| Name = 


a File Edit View Run Kernel Tabs Settings 


Last Modified 


| 
| [A] jupyter-exemple.ipynb 
e Wy test.ipynb 

IN jupyter-logo.png 


T] 


3 months ago 
2 months ago 


3 months ago 


Help 


El Launcher 


Python 3 R 


Console 
D QR 


Python 3 R 
Other 
Terminal Text File 


FIGURE 18.14 — Interface de JupyterLab. 
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O, 


File Edit View Run Kernel Tabs Settings Help 


Ba OPEN TABS El Launcher X [F] jupyter-exemple.ipynb X [Ml test.ipynb x F] Output View x 

E > < E c PEEP 

E Launcher @+x OO > m C Code ia Python3 O <matplotlib.lines.Line2D at 0x7f22768e3 
N "| jupyter-exemple.ipynt X | e48>] 
=A) F] test.ipynb x a=2 Concentration de produit en fonction du temps _ 

b= 7 » 

e s- pierre@jeera:jupyter X print(a + b) p 

"| Output View X 5 i j 


[11]: def ma_fonction(x, y): 
return x + y 


ma_fonction(a, 10) 


12 


ma_fonction("Bonjour", "Jupyter") 


E pierre@jeera:jupyter x 


FIGURE 18.15 — JupyterLab comme environnement d’ analyse. 
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Chapitre 19 


Avoir la classe avec les objets 


La programmation orientée objet (POO) est un concept de programmation très puissant qui permet de structurer ses 
programmes d’une manière nouvelle. En POO, on définit un « objet » qui peut contenir des « attributs » ainsi que des « 
méthodes » qui agissent sur lui-même. Par exemple, on définit un objet « citron » qui contient les attributs « saveur » et 
« couleur », ainsi qu’une méthode « presser » permettant d’en extraire le jus. En Python, on utilise une « classe » pour 
construire un objet. Dans notre exemple, la classe correspondrait au « moule » utilisé pour construire autant d’objets citrons 
que nécessaire. 


Définition 

Une classe définit des objets qui sont des instances (des représentants) de cette classe. Dans ce chapitre on utilisera les 
mots objet ou instance pour désigner la même chose. Les objets peuvent posséder des attributs (variables associées aux 
objets) et des méthodes (qui sont des fonctions associées aux objets et qui peuvent agir sur ces derniers ou encore les utiliser). 


Dans les chapitres précédents, nous avons déjà mentionné qu’en Python tout est objet. Une variable de type int est en fait 
un objet de type int, donc construit à partir de la classe int. Pareil pour les float et string. Mais également pour les list, tuple, 
dict, etc. Voilà pourquoi nous avons rencontré de nombreuses notations et mots de vocabulaire associés à la POO depuis le 
début de ce cours. 

La POO permet de rédiger du code plus compact et mieux ré-utilisable. L'utilisation de classes évite l’utilisation de va- 
riables globales en créant ce qu’on appelle un espace de noms propre à chaque objet permettant d’y encapsuler des attributs 
et des méthodes. De plus, la POO amène de nouveaux concepts tels que le polymorphisme (capacité à redéfinir le comporte- 
ment des opérateurs, nous avons déjà vu ces mots vous en souvenez-vous ?), ou bien encore l’héritage (capacité à définir une 
classe à partir d’une classe pré-existante et d’y ajouter de nouvelles fonctionnalités). Tous ces concepts seront définis dans ce 
chapitre. 

Malgré tous ces avantages, la POO peut paraître difficile à aborder pour le débutant, spécialement dans la conception 
des programmes / algorithmes. Elle nécessite donc la lecture de nombreux exemples, mais surtout beaucoup de pratique. 
Bien structurer ses programmes en POO est un véritable art. Il existe même des langages qui formalisent la construction de 
programmes orientés objets, par exemple le langage UML !. 

Dans ce chapitre nous allons vous présenter une introduction à la POO avec Python. Nous vous donnerons tous les éléments 
pour démarrer la construction de vos premières classes. 

Après la lecture de ce chapitre, vous verrez d’un autre ceil de nombreux exemples évoqués dans les chapitres précédents, 
et vous comprendrez sans doute de nombreuses subtilités qui avaient pu vous paraître absconses. 

Enfin, il est vivement recommandé de lire ce chapitre avant d’aborder le chapitre 20 Fenêtres graphiques et Tkinter. 


19.1 Construction d’une classe 


Nous allons voir dans cette rubrique comment définir une classe en reprenant notre exemple sur le citron que nous allons 
faire évoluer et complexifier. Attention, certains exemples sont destinés à vous montrer comment les classes fonctionnent 
mais leur utilisation n’aurait pas de sens dans un vrai programme. Ainsi, nous vous donnerons plus loin dans ce chapitre les 
pratiques recommandées. 


1. https://fr.wikipedia.org/wiki/UML_ (informatique) 
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19.1.1 La classe minimale 


En Python, le mot-clé class permet de créer sa propre classe, suivi du nom de cette classe. On se souvient, un nom 
de classe commence toujours par une majuscule (voir le chapitre 15 Bonnes pratiques en programmation Python). Comme 
d'habitude, cette ligne attend un bloc d’instructions indenté définissant le corps de la classe. Voyons un exemple simple dans 
l’interpréteur : 


>>> class Citron: 
pass 


>>> Citron 

<class '__main__.Citron'> 

>>> type (Citron) 

<class 'type'> 

>>> citroni = Citron() 

>>> citroni 

<__main__.Citron object at 0x7ff2193a20f0> 
>>> 


Ligne 1. La classe Citron est définie. Pas besoin de parenthèses comme avec les fonctions dans un cas simple comme 
celui-là (nous verrons d’autres exemples plus loin où elles sont nécessaires). 

Ligne 2. La classe ne contient rien, mais il faut mettre au moins une ligne, on met donc ici le mot-clé Python pass qui ne 
fait rien (comme dans une fonction qui ne fait rien). 

Lignes 4 et 5. Quand on tape le nom de notre classe Citron, Python nous indique que cette classe est connue. 

Lignes 6 et 7. Lorsqu'on regarde le type de notre classe Citron, Python nous indique qu'il s’agit d’un type au même titre 
que type(int). Nous avons donc créé un nouveau type ! 

Ligne 8. On crée une instance de la classe Citron, c’est-à-dire qu’on fabrique un représentant ou objet de la classe Citron 
que nous nommons citroni. 

Lignes 9 et 10. Lorsqu’on tape le nom de l’instance citron1, l’interpréteur nous rappelle qu’il s’agit d’un objet de type 
Citron ainsi que son adresse en mémoire. 

Il est également possible de vérifier qu’une instance est bien issue d’une classe donnée avec la fonction isinstance() : 


>>> isinstance(citroni, Citron) 
True 


19.1.2 Ajout d’un attribut d’instance 


Reprenons notre classe Citron et l'instance citron1 créée précédemment. Regardons les attributs et méthodes que cet 
objet possède, puis tentons de lui ajouter un attribut : 


>>> dir(citron1) 


['__class__', +. delattr__*", '__dict__', [...], '__weakref__'] 

>>> citroni.couleur = "jaune" 

>>> dir(citroni) 

['__class__', '__delattr__', '__dict__', [...], '__weakref__', 'couleur '] 
>>> citroni.couleur 

' jaune ' 


Lignes | et 2. L objet possède de nombreuses méthodes ou attributs qui commencent et qui se terminent par deux caractères 
underscores. On se souvient que les underscores indiquent qu’il s’agit de méthodes ou attributs destinés au fonctionnement 
interne de l’objet. Nous reviendrons sur certains d’entre-eux dans la suite. 

Ligne 3. Ici on ajoute un attribut . couleur à l’instance citron1. Notez bien la syntaxe instance.attribut et le point 
qui lie les deux. 

Lignes 4 à 5. La fonction dir () nous montre que l'attribut . couleur a bien été ajouté à l’objet. 

Lignes 6. La notation instance .attribut donne accès à l’ attribut de l’objet. 

Lattribut nommé .__dict__ est particulièrement intéressant. Il s’agit d’un dictionnaire qui listera les attributs créés 
dynamiquement dans l’instance en cours : 


>>> citroni = Citron() 

>>> citroni.__dict__ 

{} 

>>> citroni.couleur = "jaune" 
>>> citroni.__dict__ 


{'couleur ‘jaune '} 


L’ajout d’un attribut depuis l’extérieur de la classe (on parle aussi du côté « client ») avec une syntaxe instance .nouvel_attribut 
= valeur, créera ce nouvel attribut uniquement pour cette instance : 
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citroni = Citron() 
citroni.couleur = "jaune" 
>>> citroni.__dict__ 
{'couleur': 'jaune'} 

>>> citron2 = Citron() 
>>> citron2.__dict__ 

{} 


Si on crée une nouvelle instance de Citron, ici citron2, elle n’aura pas l’attribut 
couleur à sa création. 


Définition 

Une variable ou attribut d’instance est une variable accrochée à une instance et qui est spécifique à cette instance. Cet 
attribut n’existe donc pas forcément pour toutes les instances d’une classe donnée, et d’une instance à l’autre il ne pren- 
dra pas forcément la méme valeur. On peut retrouver tous les attributs d’instance d’une instance donnée avec une syntaxe 
instance. dict__. 


L'instruction del fonctionne bien sûr pour détruire un objet (par exemple 
del citron1), mais permet également de détruire un attribut d'instance. Si on reprend notre exemple citron1 ci-dessus : 


>>> citroni.__dict__ 
{'couleur': 'jaune'} 
>>> del citroni.couleur 
>>> citroni.__dict__ 

{} 


Dans la suite on montrera du code à tester dans un script, n’hésitez pas comme d’habitude à le tester vous-même. 


19.1.3 Les attributs de classe 


Si on ajoute une variable dans une classe comme on créait une variable locale dans une fonction, on crée ce qu’on appelle 
un attribut de classe : 


class Citron: 
couleur = "jaune" 


Définition 
Une variable de classe ou attribut de classe est un attribut qui sera identique pour chaque instance. On verra plus bas 
que de tels attributs suivent des règles différentes par rapport aux attributs d’ instance. 


A l’extérieur ou à l’intérieur d’une classe, un attribut de classe peut se retrouver avec une syntaxe NomClasse.attribut : 


print (Citron. couleur) 


Ce code affiche jaune. L’attribut de classe est aussi visible depuis n’importe quelle instance : 


class Citron: 


couleur = "jaune" 

if __name__ == "__main__": 
citroni = Citron() 
print (citroni.couleur) 
citron2 = Citron() 


print (citron2.couleur) 


L'exécution de ce code affichera : 


jaune 
jaune 


Attention 
Méme si on peut retrouver un attribut de classe avec une syntaxe instance.attribut, un tel attribut ne peut pas étre 

modifié avec une syntaxe 

instance.attribut = nouvelle_valeur (voir la rubrique Différence entre les attributs de classe et d’instance). 


184 Cours de Python / Université de Paris / UFR Sciences du Vivant 


19.1. Construction d’une classe Chapitre 19. Avoir la classe avec les objets 


19.1.4 Les méthodes 


Dans notre classe on pourra aussi ajouter des fonctions. 


Définition 

Une fonction définie au sein d’une classe est appelée méthode. Pour exécuter une méthode à l’extérieur de la classe, la 
syntaxe générale est instance .méthode(). En général, on distingue attributs et méthodes (comme nous le ferons systé- 
matiquement dans ce chapitre). Toutefois il faut garder à l’esprit qu’une méthode est finalement un objet de type fonction. 
Ainsi, elle peut être vue comme un attribut également, concept que vous croiserez peut-être en consultant de la documentation 
externe. 


Voici un exemple d’ajout d’une fonction, ou plus exactement d’une méthode, au sein d’une classe (attention à l’indenta- 
tion!) : 


class Citron: 
def coucou(self): 


print ("Coucou, je suis la mth .coucou() dans la classe Citron !") 
if __name__ == "__main__": 
citroni = Citron() 


citroni.coucou() 


Lignes 2 et 3. On définit une méthode nommée .coucou() qui va afficher un petit message. Attention, cette méthode 
prend obligatoirement un argument que nous avons nommé ici self. Nous verrons dans les deux prochaines rubriques la 
signification de ce self. Si on a plusieurs méthodes dans une classe, on saute toujours une ligne entre elles afin de faciliter la 
lecture (comme pour les fonctions). 

Ligne 7 et 8. On crée l’instance citron1 de la classe Citron, puis on exécute la méthode . coucou() avec une syntaxe 
instance.méthode(). 

Une méthode étant une fonction, elle peut bien súr retourner une valeur : 


class Citron: 


def recup_saveur (self): 
return "acide" 


if __name__ == "__main__": 
citroni = Citron() 
saveur _citroni = citroni.recup_saveur() 


print(saveur_citroni) 


Vous l’aurez deviné, ce code affichera acide à l’écran. Comme pour les fonctions, une valeur retournée par une méthode 
est récupérable dans une variable, ici saveur_citroni. 


19.15 Le constructeur 


Lors de l’instanciation d’un objet à partir d’une classe, il peut être intéressant de lancer des instructions comme par exemple 
initialiser certaines variables. Pour cela, on ajoute une méthode spéciale nommée .__init__() : cette méthode s’appelle le 
« constructeur » de la classe. Il s’agit d’une méthode spéciale dont le nom est entouré de doubles underscores : en effet, elle 
sert au fonctionnement interne de notre classe, et sauf cas extrêmement rare, elle n’est pas supposée être lancée comme une 
fonction classique par l’utilisateur de la classe. Ce constructeur est exécuté à chaque instanciation de notre classe, et ne renvoie 
pas de valeur, il ne possède donc pas de return. 


Remarque 
Pour les débutants, vous pouvez sauter cette remarque. Certains auteurs préfèrent nommer .__ïinit__() « instantiateur 
» ou « initialisateur », pour signifier qu'il existe une autre méthode appelée .__new__() qui participe à la création d’une 


instance. Vous n’avez bien sûr pas à retenir ces détails pour continuer la lecture de ce chapitre, retenez simplement que nous 
avons décidé de nommer la méthode .__init__() « constructeur » dans cet ouvrage. 


Pour bien comprendre comment cela fonctionne, nous allons suivre un exemple simple avec le site Python Tutor? (déjà 


2. http://www.pythontutor.com 


Cours de Python / Université de Paris / UFR Sciences du Vivant 


185 


Chapitre 19. Avoir la classe avec les objets 


19.1. Construction d’une classe 


Python 3.6 


class Citron: 


def init (self): 


self.couleur = "jaune" 
= if name == ' main_': 
citroni = Citron() 


print (citronl.couleur) 


Edit this code 
line that has just executed 
=> next line to execute 


Click a line of code to set a breakpoint; use the Back and Forward buttons to jump there. 


<< First < Back | Step 2 of 7 | Forward > Last >> 


Print output (drag lower right corner to resize) 


Frames Objects 


Global frame Citron class 
hide attributes 


FIGURE 19.1 — Fonctionnement d’un constructeur (étape 1). 


Python 3.6 


class Citron: 
=> def init (self): 


self.couleur = "jaune" 


LE name == ' main ': 


citronl. = Citron) 


print (citronl.couleur) 


Edit this code 
line that has just executed 
==» next line to execute 


Click a line of code to set a breakpoint; use the Back and Forward buttons to jump there. 


<< First <Back Step 4 of 7 | Forward > Last >> 


i — a 
Citron ae function 
—init_| init (self) 
Print output (drag lower right corner to resize) 
# 
Frames Objects 
Global frame Citron class 
ide attributes 
Citron De function 
—init_| init (self) 
he 


eo > Citron instance 
self 


FIGURE 19.2 — Fonctionnement d’un constructeur (étape 2). 


utilisé dans les chapitres 9 et 12 sur les fonctions). N’hésitez pas 4 copier/coller ce code dans Python Tutor pour le tester 


vous-méme : 


class Citron: 
def __init__(self): 


self.couleur = "jaune" 
if __name__ == "__main__": 
citroni = Citron() 


print (citroni.couleur) 


Étape 1 (voir figure 19.1). Au départ, Python Tutor nous montre que la classe Citron a été mise en mémoire, elle contient 


pour l’instant la méthode .__init__(). 


Étape 2 (voir figure 19.2). Nous créons ensuite l’instance citron1 à partir de la classe Citron. Notre classe Citron 


contenant une méthode . 


__init__O (le constructeur), celle-ci est immédiatement exécutée au moment de I’ instanciation. 


Cette méthode prend un argument nommé self : cet argument est obligatoire. Il s’agit en fait d’une référence vers |’ instance 
en cours (instance que nous appellerons citron1i de retour dans le programme principal, mais cela serait vrai pour n'importe 
quel autre nom d’ instance). Python Tutor nous indique cela par une flèche pointant vers un espace nommé Citron instance. 


La signification du self est expliquée en détail dans la rubrique suivante. 


Étape 3 (voir figure 19.3). Un nouvel attribut est créé s’ appelant self . couleur. La chaîne de caractères couleur est ainsi 
« accrochée » (grace au caractère point) à l’instance en cours référencée par le self. Python Tutor nous montre cela par une 
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Python 3.6 Print output (drag lower right corner to resize) 


class Citron: 


def init (self): 


= self.couleur = "jaune" Frames Objects 
Global frame Citron class 
hide attributes 
TE name == ' main ': Citron init ete 
citron! = Citron () ue +0 °° 
print (citronl.couleur) E 
sal RE instance 
Edit this code Return couleur "jaune" 
line that has just executed value |None de 


=> next line to execute 


Click a line of code to set a breakpoint; use the Back and Forward buttons to jump there. 


<< First <Back Step6of7 | Forward > Last >> 


FIGURE 19.3 — Fonctionnement d’un constructeur (étape 3). 


Python 3.6 Print output (drag lower right corner to resize) 


jaune 
class Citron: 


def _ init_ (self): 


self.couleur = "jaune" Frames Objects 
Global frame Citron class 
hide attributes 
i E => 
LE name == ' main ': Citron init function 
citronl = Citron() citron1 a] — Dit (sell) 


print (citronl.couleur) 
Citron instance 


Edit this code couleur | "jaune" 


Click a line of code to set a breakpoint; use the Back and Forward buttons to jump there. 


line that has just executed 
=> next line to execute 


<< First <Back Program terminated Forward > Last >> 


FIGURE 19.4 — Fonctionnement d’un constructeur (étape 4). 


flèche qui pointe depuis le self vers la variable couleur (qui se trouve elle-même dans l’espace nommé Citron instance). 
Si d’autres attributs étaient créés, ils seraient tous répertoriés dans cet espace Citron instance. Vous l’aurez compris, 
l’attribut couleur est donc une variable d'instance (voir rubrique Ajout d'un attribut d’instance ci-dessus). La méthode 

__init__ (© étant intrinsèquement une fonction, Python Tutor nous rappelle qu’elle ne renvoie rien (d’où le None dans la 
case Return value) une fois son exécution terminée. Et comme avec les fonctions classiques, l’espace mémoire contenant les 
variables locales à cette méthode va être détruit une fois son exécution terminée. 


Étape 4 (voir figure 19.4). De retour dans le programme principal, Python Tutor nous indique que citron1 est une 
instance de la classe Citron par une flèche pointant vers l’espace Citron instance. Cette instance contient un attribut 
nommé couleur auquel on accéde avec la syntaxe citroni.couleur dans le print (). Notez que si l’instance s’était 
appelée enorme_citron, on aurait utilisé enorme_citron.couleur pour accéder à l’attribut couleur. 


Conseil 


Dans la mesure du possible, nous vous conseillons de créer tous les attributs d’instance dont vous aurez besoin dans le 


constructeur .__init__() plutôt que dans toute autre méthode. Ainsi ils seront visibles dans toute la classe dès l’instancia- 
tion. 
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19.1.6 Passage d’argument(s) à l’instanciation 


Lors de l’instanciation, il est possible de passer des arguments au constructeur. Comme pour les fonctions, on peut passer 
des arguments positionnels ou par mot-clé et en créer autant que l’on veut (voir chapitre 9 Fonctions). Voici un exemple : 


class Citron: 


def __init__(self, masse, couleur="jaune"): 
self.masse = masse 
self.couleur = couleur 

if __name__ == "__main__": 

citroni = Citron(100) 

print ("citroni:", citroni.__dict__) 

citron2 = Citron(150, couleur="blanc") 

print ("citron2:", citron2.__dict__) 


On a ici un argument positionnel (masse) et un autre par mot-clé (couleur). Le code donnera la sortie suivante : 


citroni: {'masse': 100, 'couleur': 'jaune'} 
citron2: {'masse': 150, 'couleur': 'blanc'} 


19.1.7 Mieux comprendre le rôle du self 


Cette rubrique va nous aider à mieux comprendre le rôle du self à travers quelques exemples simples. Regardons le code 
suivant dans lequel nous créons une nouvelle méthode .affiche_attributs() : 


class Citron: 


def __init__(self, couleur="jaune"): 
self.couleur = couleur 
var = 2 


def affiche _attributs(self): 
print(self) 
print(self.couleur) 
print (var) 


if __name__ == "__main__": 


citroni = Citron() 
citroni.affiche_attributs () 


Ligne 3. On crée l’attribut couleur que l’on accroche à l’instance avec le self. 

Ligne 4. Nous créons cette fois-ci une variable var sans l’accrocher au self. 

Ligne 6. Nous créons une nouvelle méthode dans la classe Citron qui se nomme 
.affiche_attributs(). Comme pour le constructeur, cette méthode prend comme premier argument une variable obliga- 
toire, que nous avons à nouveau nommée self. Il s’agit encore une fois d’une référence vers l’objet ou instance créé(e). On 
va voir plus bas ce qu’elle contient exactement. 


Attention 
On peut appeler cette référence comme on veut, toutefois nous vous conseillons vivement de l’appeler self car c’est une 
convention générale en Python. Ainsi, quelqu’un qui lira votre code comprendra immédiatement de quoi il s’agit. 


Ligne 7. Cette ligne va afficher le contenu de la variable self. 

Lignes 8 et 9. On souhaite que notre méthode .affiche_attributs() affiche ensuite l’attribut de classe .couleur ainsi 
que la variable var créée dans le constructeur .__init__(). 

L'exécution de ce code donnera : 


$ python classe _exempleli.py 
<__main__.Citron object at 0x7f4e5fb71438> 


jaune 
Traceback (most recent call last): 
File "classe_exemplel.py", line 14, in <module> 
citroni.affiche attributs) 
File "classe _exemplei.py", line 9, in affiche attributs 


print (var) 


NameError: name ' 


var is not defined 
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Ligne 2. La méthode .affiche_attributs() montre que le self est bien une référence vers l’instance (ou objet) 
citroni (ou vers n’importe quelle autre instance, par exemple si on crée citron2 = Citron() le self sera une référence 
vers citron2). 

Ligne 3. La méthode .affiche_attributs() affiche l’attribut .couleur qui avait été créé précédemment dans le 
constructeur. Vous voyez ici l’intérêt principal de l’argument self passé en premier à chaque méthode d’une classe : il « 
accroche » n’importe quel attribut qui sera visible partout dans la classe, y compris dans une méthode où il n’a pas été défini. 

Lignes 4 à 9. La création de la variable var dans la méthode .__init__() sans l’accrocher à l’objet self fait qu’elle 
n’est plus accessible en dehors de .__init__(). C’est exactement comme pour les fonctions classiques, var est finalement 
une variable locale au sein de la méthode .__init__() et n’est plus visible lorsque l’exécution de cette dernière est terminée 
(cf. chapitres 9 et 12 sur les fonctions). Ainsi, Python renvoie une erreur car var n’existe pas lorsque .affiche_attributs() 
est en exécution. 

En résumé, le self est nécessaire lorsqu’on a besoin d’accéder à différents attributs dans les différentes méthodes d’une 
classe. Le self est également nécessaire pour appeler une méthode de la classe depuis une autre méthode : 

class Citron: 


def __init__(self, couleur="jaune"): 
self.couleur = couleur 


self.affiche message() 


def affiche _ message (self): 


print ("Le citron c'est trop bon !") 
if __name__ == "__main__": 
citroni = Citron("jaune pale") 


Ligne 4. Nous appelons ici la méthode .affiche_message() depuis le constructeur. Pour appeler cette méthode interne 
à la classe Citron, on doit utiliser une syntaxe self .méthode(). Le self sert donc pour accéder aux attributs mais aussi 
aux méthodes, ou plus généralement à tout ce qui est accroché à la classe. 

Lignes 6 et 7. La méthode .affiche_message() est exécutée. On peut se poser la question Pourquoi passer l’argument 
self à cette méthode alors qu’on ne s’en sert pas dans celle-ci ? 


Attention 

Même si on ne se sert d’aucun attribut dans une méthode, l’argument self (ou quel que soit son nom) est strictement 
obligatoire. En fait, la notation citron1.affiche_message() est équivalente à Citron.affiche_message(citron1). 
Testez les deux pour voir! Dans cette dernière instruction, on appelle la méthode accrochée à la classe Citron et on lui 
passe explicitement l’instance citron1 en tant qu'argument. La notation citron1.affiche_message() contient donc en 
filigrane un argument, à savoir, la référence vers l’instance citron1i que l’on appelle self au sein de la méthode. 


Conseil : c’est la première notation citroni.affiche_attributs() (ou plus généralement instance .méthode()), 
plus compacte, qui sera toujours utilisée. 

Ligne 11. On crée l’instance citron1 en lui passant l’argument "jaune pâle". La variable d’instance couleur prendra 
ainsi cette valeur au lieu de celle par défaut ("jaune"). À noter, l'instanciation affichera le message Le citron c'est trop 
bon ! puisque la méthode .affiche_attributs() est appelée dans le constructeur .__init__(). 

Afin de bien comprendre les différentes étapes des codes de cette rubrique, nous vous conseillons de les retester de votre 
côté dans Python Tutor. 


19.1.8 Différence entre les attributs de classe et d’instance 


On a vu ci-dessus comment créer un attribut de classe, il suffit de créer une variable au sein de la classe (en dehors de toute 
méthode). En général, les attributs de classe contiennent des propriétés générales à la classe puisqu’ils vont prendre la même 
valeur quelle que soit l’instance. 

Au contraire, les attributs d’instance sont spécifiques à chaque instance. Pour en créer, on a vu qu'il suffisait de les 
initialiser dans la méthode .__init__ O) en utilisant une syntaxe self .nouvel_attribut = valeur. On a vu aussi dans 
la rubrique Ajout d’un attribut d’instance que l’on pouvait ajouter un attribut d’instance de l’extérieur avec une syntaxe 
instance.nouvel attribut = valeur. 

Bien que les deux types d’attributs soient fondamentalement différents au niveau de leur finalité, il existe des similitudes 
lorsqu'on veut accéder à leur valeur. Le code suivant illustre cela : 
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Python 3.6 Print output (drag lower right corner to resize) 
A Attributs de classe : ellipsoide acide 
class Citron: Attributs d'instance : standard jaune 0 
; as Attributs d'instance : standard j > 100 
forme = "ellipsoide" # attribut de classe Fe A aa ie AE 
saveur = "acide" # attribut de classe 
4 
def _ init__(self, couleur="jaune", taille="stande Frames Objects 
self.couleur = couleur # attribut d'instance 
Global frame Citron class 
self.taille = taille # attribut d'instance hide attributes 
self.masse = masse # attribut d'instance (mass Citron function 
citroni __init__(self, couleur, taille, masse) 
default arguments: 
def augmente masse(self, masse): 38 x 
self.masse += masse init eaen “jaune 
taille | "standard" 
masse | 0 
if _ name == ' _ main ': ===> 
citron1 = Citron() augmente_masse function 
4 A ; Ñ | ti 1f, 
print("Attributs de classe :", citronl.forme, city anopin te Bea tee makse 
print("Attributs d'instance :", citronl.taille, ci forme} "ellipsoide" 
citronl.masse) SUN acide" 
citronli.augmente masse (100) 


EP E Oe a A 
< > Citron instance 
i i couleur | "jaune" 
Edit this code 
line that has just executed masse | 100 


=> next line to execute 


taille | "standard" 


Click a line of code to set a breakpoint; use the Back and Forward buttons to jump there. 


<< First <Back Program terminated Forward > Last >> 


FIGURE 19.5 — Illustration de la signification des attributs de classe et d'instance avec Python Tutor. 


class Citron: 
forme = "ellipsoide" # attribut de classe 
saveur = "acide" # attribut de classe 


def __init__(self, couleur="jaune", taille="standard", masse=0): 
self.couleur = couleur # attribut d'instance 
self.taille = taille # attribut d'instance 


self.masse = masse # attribut d'instance (masse en gramme) 


def augmente_masse(self, valeur): 
self.masse += valeur 


if __name__ == "__main__": 
citroni = Citron() 
print ("Attributs de classe :", citroni.forme, citroni.saveur) 
print ("Attributs d'instance :", citroni.taille, citroni.couleur, 


citroni.masse) 

citroni.augmente _masse (100) 

print ("Attributs d'instance :", citroni.taille, citroni.couleur, 
citroni.masse) 


Lignes 2 et 3. Nous créons deux variables de classe qui seront communes à toutes les instances (disons qu’un citron sera 
toujours ellipsoïde et acide !). 

Lignes 6 à 8. Nous créons trois variables d’instance qui seront spécifiques à chaque instance (disons que la taille, la couleur 
et la masse d’un citron peuvent varier !), avec des valeurs par défaut. 

Lignes 10 et 11. On crée une nouvelle méthode .augmente_masse() qui augmente l’attribut d'instance .masse. 

Ligne 14 à 21. Dans le programme principal, on instancie la classe Citron sans passer d’argument (les valeurs par défaut 
"jaune", "standard" et 0 seront donc prises), puis on imprime les attributs. 

La figure 19.5 montre l’état des variables après avoir exécuté ce code grâce au site Python Tutor”. 

Python Tutor montre bien la différence entre les variables de classe forme et saveur qui apparaissent directement dans 
les attributs de la classe Citron lors de sa définition et les trois variables d’instance couleur, taille et masse qui sont liées 
à l'instance citron1. Pour autant, on voit dans la dernière instruction print () qu’on peut accéder de la même manière aux 
variables de classe ou d’instance, lorsqu'on est à l’extérieur, avec une syntaxe instance .attribut. 

Au sein des méthodes, on accède également de la même manière aux attributs de classe ou d’instance, avec une syntaxe 
self.attribut : 


class Citron: 
saveur = "acide" # attribut de classe 


3. http://www.pythontutor.com 
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def __init__(self, couleur="jaune"): 
self.couleur = couleur # attribut d'instance 


def affiche _attributs(self): 
print(f"attribut de classe: {self.saveur}") 
print (f'"attribut d'instance: {self.couleur}") 


if __name__ == "__ main __": 


citroni = Citron() 
citroni.affiche attributs) 


Ce code va afficher la phrase : 


attribut de classe: acide 
attribut d'instance: jaune 
En résumé, qu’on ait des attributs de classe ou d’instance, on peut accéder à eux de l’extérieur par instance.attribut 
et de l’intérieur par self .attribut. 
Qu'en est-il de la manière de modifier ces deux types d’attributs ? Les attributs d’instance peuvent se modifier sans pro- 
blème de l’extérieur avec une syntaxe instance.attribut_d_ instance = nouvelle _ valeur et de l’intérieur avec une 
syntaxe self.attribut_d_instance = nouvelle _valeur. Ce n'est pas du tout le cas avec les attributs de classe. 


Attention 

Les attributs de classe ne peuvent pas être modifiés ni à l’extérieur d'une classe via une syntaxe instance .attribut_de_classe 
= nouvelle _ valeur, ni à l’intérieur d'une classe via une syntaxe self .attribut_de_ classe = nouvelle valeur. 
Puisqu’ils sont destinés à être identiques pour toutes les instances, cela est logique de ne pas pouvoir les modifier via une 
instance. Les attributs de classe Python ressemblent en quelque sorte aux attributs statiques du C++. 


Regardons l’exemple suivant illustrant cela : 


class Citron: 
saveur = "acide" 
oe a -main ": 
citroni = Citron() 
print(citroni.saveur) 
citroni.saveur = "sucrée" 
print(citroni.saveur) # on regarde ici avec Python Tutor 
del citroni.saveur 
print(citroni.saveur) # on regarde ici avec Python Tutor 
del citroni.saveur 


if name == " 


À la ligne 7, on pourrait penser qu’on modifie l’attribut de classe saveur avec une syntaxe instance.attribut_de_ classe 
= nouvelle _valeur. Que se passe-t-il exactement ? La figure 19.7 nous montre l’état des variables grâce au site Python Tu- 
tor. Celui-ci indique que la ligne 7 a en fait créé un nouvel attribut d’instance citron1.saveur (contenant la valeur sucrée) 
qui est bien distinct de l’attribut de classe auquel on accédait avant par le même nom! Tout ceci est dû à la manière dont Python 
gère les espaces de noms (voir rubrique Espaces de noms). Dans ce cas, l’attribut d’instance est prioritaire sur l’attribut de 
classe. 

À la ligne 9, on détruit finalement l’attribut d'instance citron1.saveur qui contenait la valeur sucrée. Python Tutor 
nous montre que citroni.saveur n’existe pas dans l’espace Citron instance qui est vide; ainsi, Python utilisera l’attribut 
de classe . saveur qui contient toujours la valeur acide (cf. figure 19.7). 

La ligne 11 va tenter de détruire l’attribut de classe .saveur. Toutefois, Python interdit cela, ainsi l’erreur suivante sera 
générée : 

Traceback (most recent call last): 


File "./test.py", line 10, in <module> 
del(citroni.saveur) 


AttributeError: saveur 
En fait, la seule manière de modifier un attribut de classe est d’utiliser une syntaxe 
NomClasse.attribut de classe = nouvelle valeur, 
dans l’exemple ci-dessus cela aurait été Citron.saveur = "sucrée". De même, pour sa destruction, il faudra utiliser la 
même syntaxe : del Citron.saveur. 


Conseil 
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19.1. Construction d’une classe 


Python 3.6 
class Citron: 
saveur = "acide" 
iE name == ' main ': 
citronl = Citron() 


print (citronl.saveur) 
citronl.saveur = "sucrée" 


print(citronl.saveur) # on regarde ici avec Pythontu 


nd del citronl.saveur 
print (citronl.saveur) # on regarde ici avec Pythontu 
del citronl.saveur 

< > 


Edit this code 


line that has just executed 
=> next line to execute 


Click a line of code to set a breakpoint; use the Back and Forward buttons to jump there. 


Forward > 


<< First < Back Step 7 of 9 Last >> 


Print output (drag lower right corner to resize) 


acide 
sucrée 


FIGURE 19.6 — Illustration avec Python Tutor de la non destruction d’un attribut de classe (étape 1). 


Python 3.6 
class Citron: 
saveur = "acide" 
1£ name == ' main ': 
citroni = ¡Citron() 


print (citronl.saveur) 
citronl.saveur = "sucrée" 
print(citronl.saveur) # on regarde ici avec Pythontu 
del citronl.saveur 
1 print (citronl.saveur) # on regarde ici avec Pythontu 


del citronl.saveur 


Edit this code 


line that has just executed 
=> next line to execute 


Click a line of code to set a breakpoint; use the Back and Forward buttons to jump there. 
0 


<< First <Back Step9of9 | Forward > Last >> 


4 
Frames Objects 
Global frame Citron class 
d hide attributes 
a | —_— => 
Citron É A acide" 
citroni | 
Citron instance 
saveur | "sucrée" 
Print output (drag lower right corner to resize) 
acide 
sucrée 
acide 
4 
Frames Objects 
Global frame Citron class 


hide attributes 


citron1 a 


Citron 


Citron instance 


FIGURE 19.7 — Illustration avec Python Tutor de la non destruction d’un attribut de classe (étape 2). 
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Même si on peut modifier un attribut de classe, nous vous déconseillons de le faire. Une utilité des attributs de classe 
est par exemple de définir des constantes (mathématique ou autre), donc cela n’a pas de sens de vouloir les modifier ! Il est 
également déconseillé de créer des attributs de classe avec des objets modifiables comme des listes et des dictionnaires, cela 
peut avoir des effets désastreux non désirés. Nous verrons plus bas un exemple concret d’attribut de classe qui est très utile, à 
savoir le concept d’objet de type property. 


Si vous souhaitez avoir des attributs modifiables dans votre classe, créez plutôt des attributs d’instance dans le .__init__(). 


19.2 Espace de noms 


Nous faisons ici une petite digression sur le concept d’espace de noms, car il est important de bien le comprendre lorsqu’on 
étudie les classes. Nous avons déjà croisé ce concept à plusieurs reprises. D’abord dans le chapitre 12 Plus sur les fonctions, 
puis dans le chapitre 14 Création de modules, et maintenant dans ce chapitre. De quoi s’agit-11? 


Définition 
Dans la documentation officielle *, un espace de noms est défini comme suit : « a namespace is a mapping from names to 
objects ». Un espace de noms, c’est finalement une correspondance entre des noms et des objets. Un espace de noms peut être 
vu aussi comme une capsule dans laquelle on trouve des noms d’objets. Par exemple, le programme principal ou une fonction 
représentent chacun un espace de noms, un module aussi, et bien sûr une classe ou l'instance d’une classe également. 


Différents espaces de noms peuvent contenir des objets de même nom sans que cela ne pose de problème. Parce qu’ils sont 
chacun dans un espace différent, ils peuvent cohabiter sans risque d’écrasement de l’un par l’autre. Par exemple, à chaque 
fois que l’on appelle une fonction, un espace de noms est créé pour cette fonction. Python Tutor nous montre cet espace 
sous la forme d’une zone dédiée (voir les chapitres 9 et 12 sur les fonctions). Si cette fonction appelle une autre fonction, un 
nouvel espace est créé, bien distinct de la fonction appelante (ce nouvel espace peut donc contenir un objet de même nom). 
En définitive, ce qui va compter, c’est de savoir quelles règles Python va utiliser pour chercher dans les différents espaces de 
noms pour finalement accéder à un objet. 

Nous allons dans cette rubrique refaire le point sur ce que l’on a appris dans cet ouvrage sur les espaces de noms en Python, 
puis se pencher sur les spécificités de ce concept dans les classes. 


19.2.1 Rappel sur la règle LGI 


Comme vu dans le chapitre 9 Fonctions, la règle LGI peut être résumée ainsi : Local > Global > Interne. Lorsque Python 
rencontre un objet, il utilise cette règle de priorité pour accéder à la valeur de celui-ci. Si on est dans une fonction (ou une 
méthode), Python va d’abord chercher l’espace de noms local à cette fonction. S’il ne trouve pas de nom il va ensuite chercher 
l’espace de noms du programme principal (ou celui du module), donc des variables globales s’y trouvant. S’il ne trouve pas 
de nom, il va chercher dans les commandes internes à Python (on parle des Built-in Functions? et des Built-in Constants ô). 
Si aucun objet n’est trouvé, Python renvoie une erreur. 


19.2.2 Gestion des noms dans les modules 


Les modules représentent aussi un espace de noms en soi. Afin d’illustrer cela, jetons un coup d’ceil à ce programme 
test_var_module.py: 


import mod 


i = 1000000 

j = 2 

print ("Dans prog principal i:", i) 
print ("Dans prog principal j:", j) 
mod.fct() 

mod.fct2() 


4. https://docs.python.org/fr/3/tutorial/classes.html#python-scopes-and-namespaces 
5. https://docs.python.org/fr/3/library/functions .htm1%20comme%20par%20exemple%20%⁄%60print ()%60 
6. https://docs.python.org/fr/3/library/constants.html 
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print ("Dans prog principal i:", i) 
print ("Dans prog principal j:", j) 


Le module mod.py contient les instructions suivantes : 


def fct(): 
i = -27478524 


print ("Dans module, i local:", i) 


def fct2(): 
print ("Dans module, j global:", j) 


3.14 
-76 


L'exécution de test_var_module.py donnera : 


$ python ./test_var_module.py 
Dans prog principal i: 1000000 
Dans prog principal j: 2 

Dans module, i local: -27478524 
Dans module, j global: -76 

Dans prog principal i: 1000000 
Dans prog principal j: 2 

Lignes 3 et 4. On a bien les valeurs de i et j définies dans le programme principal de test . py. 

Lignes 9 et 10. Lorsqu’on exécute mod. fct (), la valeur de i sera celle définie localement dans cette fonction. Lorsqu’on 
exécute mod. fct2(), la valeur de j sera celle définie de manière globale dans le module. 

Lignes 12 et 13. De retour dans notre programme principal, les variables i et j existent toujours et n’ ont pas été modifiées 
par l’exécution de fonctions du module mod. py. 

En résumé, lorsqu’on lance une méthode d’un module, c’est l’espace de noms de celui-ci qui est utilisé. Bien sûr, toutes 
les variables du programme principal / fonction / méthode appelant ce module sont conservées telles quelles, et on les retrouve 
intactes lorsque l’exécution de la fonction du module est terminée. Un module a donc son propre espace de noms qui est bien 
distinct de tout programme principal / fonction / méthode appelant un composant de ce module. Enfin, les variables globales 


créées dans notre programme principal ne sont pas accessibles dans le module lorsque celui-ci est en exécution. 


19.2.3 Gestion des noms avec les classes 


On vient de voir qu’un module avait son propre espace de noms, mais qu’en est-il des classes ? En utilisant les exemples 
vus depuis le début de ce chapitre, vous avez certainement la réponse. Une classe posséde par définition son propre espace de 
noms qui ne peut étre en aucun cas confondu avec celui d’une fonction ou d’un programme principal. Reprenons un exemple 
simple : 


class Citron: 


def __init__(self, saveur="acide", couleur="jaune"): 
self.saveur = saveur 
self.couleur = couleur 
print("Dans __init__(), vous venez de créer un citron:", 


self .affiche_attributs()) 


def affiche _attributs(self): 
return f"{self.saveur}, {self.couleur}" 


if __name__ == __main__": 
saveur = "sucrée" 
couleur = "orange" 
print(f"Dans le programme principal: {saveur}, {couleur}") 
citroni = Citron("trés acide", "jaune foncé") 
print ("Dans citroni.affiche_attributs():", citroni.affiche_ attributs ()) 


print(f"Dans le programme principal: {saveur}, {couleur}") 


Lorsqu'on exécutera ce code, on obtiendra : 


Dans le programme principal: sucrée, orange 
Dans init__(), vous venez de créer un citron: très acide, jaune foncé 


Dans citron1.affiche_attributs(): très acide, jaune foncé 
Dans le programme principal: sucrée, orange 


Les deux variables globales saveur et couleur du programme principal ne peuvent pas être confondues avec les va- 
riables d'instance portant le même nom. Au sein de la classe, on utilisera pour récupérer ces dernières self .saveur et 
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self.couleur. À l'extérieur, on utilisera instance.saveur et instance. couleur. Il n’y a donc aucun risque de confu- 
sion possible avec les variables globales saveur et couleur, on accède à chaque variable de la classe avec un nom distinct 
(qu’on soit à l’intérieur ou à l’extérieur de la classe). 

Ceci est également vrai pour les méthodes. Si par exemple, on a une méthode avec un certain nom, et une fonction du 
module principal avec le même nom, regardons ce qui se passe : 


class Citron: 
def __init__(self): 
self.couleur = "jaune" 
self.affiche coucou) 
affiche _ coucou) 


def affiche _coucou(self): 
print ("Coucou interne !") 


def affiche _coucou(): 
print ("Coucou externe") 


if __name__ == "__main__": 


citroni = Citron() 
citroni.affiche coucou() 
affiche coucou) 

Lorsqu'on va exécuter le code, on obtiendra : 


Coucou interne ! 
Coucou externe 
Coucou interne ! 
Coucou externe 
A nouveau, il n’y a pas de conflit possible pour l’utilisation d’une méthode ou d’une fonction avec le même nom. A 
l’intérieur de la classe on utilise self .affiche_coucou() pour la méthode et affiche_coucou() pour la fonction. A 
l’extérieur de la classe, on utilise instance. affiche_coucou() pour la méthode et affiche_coucou() pour la fonction. 
Dans cette rubrique, nous venons de voir une propriété des classes extrémement puissante : une classe crée automati- 
quement son propre espace de noms. Cela permet d’encapsuler à l’intérieur tous les attributs et méthodes dont on a besoin, 
sans avoir aucun risque de conflit de nom avec l’extérieur (variables locales, globales ou provenant de modules). L’utilisation 
de classes évitera ainsi l’utilisation de variables globales qui, on l’a vu aux chapitres 9 et 12 sur les fonctions, sont à proscrire 
absolument. Tout cela concourt à rendre le code plus lisible. 
Dans le chapitre 20 Fenêtres graphiques et Tkinter, vous verrez une démonstration de l’utilité de tout encapsuler dans une 
classe afin d’éviter les variables globales. 


19.2.4 Gestion des noms entre les attributs de classe et d’instance 


Si vous lisez cette rubrique sur l’espace de noms sans avoir lu ce chapitre depuis le début, nous vous conseillons vivement 
de lire attentivement la rubrique Différence entre les attributs de classe et d'instance. La chose importante à retenir sur cette 
question est la suivante : si un attribut de classe et un attribut d’instance ont le même nom, c’est l’attribut d’instance qui est 
prioritaire. 


Pour aller plus loin 
Il existe d’autres règles concernant les espace de noms. L’une d’elle, que vous pourriez rencontrer, concerne la gestion des 
noms avec des fonctions imbriquées. Et oui, Python autorise cela ! Par exemple : 
def fonctioni(): 
Leea] 


def fct_dans_fonction1(): 
[...] 

La encore, il existe certaines règles de priorités d’accès aux objets spécifiques à ce genre de cas, avec |’ apparition d'un 
nouveau mot-clé nommé nonlocal. Toutefois ces aspects vont au-dela du présent ouvrage. Pour plus d’informations sur les 
fonctions imbriquées et la directive nonlocal, vous pouvez consulter la documentation officielle ?. 

D’autres subtilités concerneront la gestion des noms en cas de définition d’une nouvelle classe héritant d’une classe mére. 
Ces aspects sont présentés dans la rubrique Héritage de ce chapitre. 


7. https://docs.python.org/3/tutorial/classes.html#python-scopes-and-namespaces 
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19.3 Polymorphisme 


Nous allons voir maintenant des propriétés très importantes des classes en Python, le polymorphisme dans cette rubrique 
et l’héritage dans la suivante. Ces deux concepts donnent un surplus de puissance à la POO par rapport à la programmation 
classique. 

Commençons par le polymorphisme. Dans la vie, celui-ci évoque la capacité à prendre plusieurs apparences, qu’en est-il 
en programmation ? 


Définition 
En programmation, le polymorphisme est la capacité d’une fonction (ou méthode) à se comporter différemment en fonction 
de l’objet qui lui est passé. Une fonction donnée peut donc avoir plusieurs définitions. 


Prenons un exemple concret de polymorphisme : la fonction Python sorted() va trier par ordre ASCII si l’argument est 
une chaîne de caractères, et elle va trier par ordre croissant lorsque l’argument est une liste d’entiers : 
>>> sorted("citron") 
Cie, ETS nt, lo', “Tr, EL] 
>>> sorted([1, -67, 42, 0, 81]) 
[-67, 0, 1, 42, 81] 


Le polymorphisme est intimement lié au concept de redéfinition des opérateurs que nous avons déjà croisé à plusieurs 
reprises dans ce livre. 


Définition 
La redéfinition des opérateurs est la capacité à redéfinir le comportement d’un opérateur en fonction des opérandes utilisées 
(on rappelle dans l’expression 1 + 1, + est l’opérateur d'addition et les deux 1 sont les opérandes). 


Un exemple classique de redéfinition des opérateurs concerne l’opérateur +. Si les opérandes sont de type numérique, il 
fait une addition, si elles sont des chaînes de caractère il fait une concaténation : 


>>> 2 + 2 
4 
>>> LS rs 1 + ugin 
‘titi! 
Nous verrons dans la rubrique suivante sur l'héritage qu'il est également possible de redéfinir des méthodes d’une classe, 
c’est-à-dire leur donner une nouvelle définition. 
Comment Python permet-il ces prouesses que sont le polymorphisme et la redéfinition des opérateurs ? Et bien, il utilise 
des méthodes dites magiques. 


Définition 
Une méthode magique (magic method) est une méthode spéciale dont le nom est entouré de double underscores. Par 
exemple, la méthode .__init__() est une méthode magique. Ces méthodes sont, la plupart du temps, destinées au fonc- 


tionnement interne de la classe. Nombre d’entre elles sont destinées à changer le comportement de fonctions ou opérateurs 
internes à Python avec les instances d’une classe que l’on a créée. 


Nous allons prendre un exemple concret. Imaginons que suite à la création d’une classe, nous souhaitions que Python 
affiche un message personnalisé lors de l’utilisation de la fonction print () avec une instance de cette classe. La méthode ma- 


gique qui permettra cela est nommée .__str__() : elle redéfinit le comportement d’une instance avec la fonction print(). 
class CitronBasique: 
def __init__(self, couleur="jaune", taille="standard"): 
self.couleur = "jaune" 
self.taille = "standard" 


class CitronCool: 


def __init__(self, couleur="jaune", taille="standard"): 
self.couleur = couleur 
self.taille = taille 


def __str__(self): 
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return (f"Votre citron est de couleur {self.couleur} " 
f"et de taille {self.taille}") 


if __name__ == __main__": 
citroni = CitronBasique() 
print(citron1) 
citron2 = CitronCool("jaune foncée", "minuscule") 


print(citron2) 


Lignes 1 à 4. Création d’une classe CitronBasique dans laquelle il n’y a qu’un constructeur. 

Lignes 7 à 14. Création d’une classe CitronCool où nous avons ajouté la nouvelle méthode .__str__(). Cette dernière 
renvoie une chaîne de caractères contenant la description de l’instance. 

Lignes 18 à 21. On crée une instance de chaque classe, et on utilise la fonction print () pour voir leur contenu. 

L’exécution de ce code affichera la sortie suivante : 

<__main__.CitronBasique object at Ox7ffe23e717b8> 
Votre citron est de couleur jaune foncée et de taille minuscule 8-) 

Lutilisation de la fonction print () sur l’instance citron1 construite à partir de la classe CitronBasique affiche le 
message abscons que nous avons déjà croisé. Par contre, pour l'instance citron2 de la classe CitronCool, le texte correspond 
à celui retourné par la méthode magique .__str__(). Nous avons donc redéfini comment la fonction print () se comportait 
avec une instance de la classe CitronCool. Notez que str (citron2) donnerait le même message que print (citron2). 

Ce mécanisme pourra étre reproduit avec de trés nombreux opérateurs et fonctions de bases de Python. En effet, il existe 
une multitude de méthodes magiques, en voici quelques unes : 

— .__repr__() : redéfinit le message obtenu lorsqu’on tape le nom de l’instance dans l’interpréteur ; 

— .__add__() : redéfinit le comportement de |’ opérateur +; 

— .__mul__() : redéfinit le comportement de |’ opérateur * ; 

— .__del__() : redéfinit le comportement de la fonction del. 

Si on conçoit une classe produisant des objets séquentiels (comme des listes ou des tuples), il existe des méthodes magiques 
telles que : 

— .__len__0 : redéfinit le comportement de la fonction len () ; 

— .__getitem__() : redéfinit le comportement pour récupérer un élément; 

— .__getslice__() : redéfinit le comportement avec les tranches. 

Certaines méthodes magiques font des choses assez impressionnantes. Par exemple, la méthode .__ca11__ O) crée des 
instances que l’on peut appeler comme des fonctions ! Dans cet exemple, nous allons vous montrer que l’on peut ainsi créer 
un moyen inattendu pour mettre à jour des attributs d’instance : 


class Citronnier: 


def __init__(self, nb_citrons, age): 
self.nb_citrons, self.age = nb_citrons, age 

def __call__(self, nb_citrons, age): 
self.nb_citrons, self.age = nb_citrons, age 


def __str__(self): 
return (f"Ce citronnier a {self.age} ans " 
f"et {self.nb_citrons} citrons") 


if __name__ == "__main__": 


citronnieri = Citronnier(10, 3) 
print (citronnier1) 
citronnier1(30, 4) 
print (citronnier1) 
A la ligne 16, on utilise une notation instance (arg1, arg2), ce qui va automatiquement appeler la méthode magique 
__call__() qui mettra 4 jour les deux attributs d’instance nbcitrons et age (lignes 5 et 6). Ce code affichera la sortie 
suivante : 


Ce citronnier a 3 ans et 10 citrons 
Ce citronnier a 4 ans et 30 citrons 


Pour aller plus loin 
— Nous vous avons montré l’idée qu’il y avait derrière le polymorphisme, et avec cela vous avez assez pour vous jeter 

à l’eau et commencer à construire vos propres classes. L’apprentissage de toutes les méthodes magiques va bien sûr 
au-delà du présent ouvrage. Toutefois, si vous souhaitez aller plus loin, nous vous conseillons la page de Rafe Kettler * 


8. https://rszalski.github.io/magicmethods 
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qui est particulièrement complète et très bien faite. 


19.4 Héritage 


19.4.1 Prise en main 


L'héritage peut évoquer la capacité qu’ont nos parents à nous transmettre certains traits physiques ou de caractère (ne 
dit-on pas, j’ai hérité ceci ou cela de ma mère ou de mon père ?). Qu’en est-il en programmation ? 


Définition 
En programmation, l’ héritage est la capacité d’une classe d’hériter des propriétés d’une classe pré-existante. On parle de 
classe mère et de classe fille. En Python, l’ héritage peut être multiple lorsqu’une classe fille hérite de plusieurs classes mères. 


En Python, lorsque l’on veut créer une classe héritant d’une autre classe, on ajoutera après le nom de la classe fille le nom 
de la ou des classe(s) mère(s) entre parenthèses : 


class 
# 


class 


class 


Merel: 
contenu de la 


Mere2: 
contenu de la 


Fillei(Mere1): 


contenu de la 


Fille2(Merel, 


classe mére 1 


classe mére 2 


classe fille 1 


Mere2): 


# contenu de la classe fille 2 


Dans cet exemple, la classe Fille1 hérite de la classe Mere1 et la classe Fille2 hérite des deux classes Mere1 et Mere2. 
Dans le cas de la classe Fille2, on parle d’héritage multiple. Voyons maintenant un exemple concret : 


class Mere: 


def bonjour(self): 
return "Vous avez le bonjour de la classe mère !" 


class Fille(Mere): 
def salut(self): 


return "Un salut de la classe fille !" 
if __name__ == "__main__": 
fille = Fille() 


print(fille.salut()) 
print(fille.bonjour()) 
Lignes 1 à 3. On définit une classe Mere avec une méthode . bonjour (). 
Lignes 6 a 8. On définit une classe Fille qui hérite de la classe Mere. Cette classe fille contient une nouvelle méthode 
.salut(). 
Lignes 12 à 14. Après instanciation de la classe Fille, on utilise la méthode .salut (), puis la méthode .bonjour () 
héritée de la classe mère. 
Ce code affiche la sortie suivante : 
Un salut de la classe fille ! 
Vous avez le bonjour de la classe mère ! 
Nous commençons à entrevoir la puissance de l’héritage. Si on possède une classe avec de nombreuses méthodes et que 
l’on souhaite en ajouter de nouvelles, il suffit de créer une classe fille héritant d’une classe mère. 
En revenant à notre exemple, une instance de la classe Fille sera automatiquement une instance de la classe Mere. 
Regardons dans l’interpréteur : 


>>> fille = Fille() 


>>> isinstance(fille, Fille) 
True 

>>> isinstance(fille, Mere) 
True 
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Si une méthode de la classe fille possède le même nom que celle de la classe mère, c’est la première qui prend la prio- 
rité. Dans ce cas, on dit que la méthode est redéfinie (en anglais on parle de method overriding), tout comme on parlait de 
redéfinition des opérateurs un peu plus haut. C’est le même mécanisme, car la redéfinition des opérateurs revient finalement à 
redéfinir une méthode magique (comme par exemple la méthode .__add__() pour l’opérateur +). 

Voyons un exemple : 


class Mere: 


def bonjour (self): 
return "Vous avez le bonjour de la classe mère !" 


class Fille2(Mere): 
def bonjour (self): 
return "Vous avez le bonjour de la classe fille !" 


"__main__": 


fille = Fille2() 
print(fille.bonjour()) 


Ce code va afficher Vous avez le bonjour de la classe fille !. La méthode .bonjour() de la classe fille a 
donc pris la priorité sur celle de la classe mére. Ce comportement provient de la gestion des espaces de noms par Python, il 
est traité en détail dans la rubrique suivante. 


Remarque 

Á ce point, nous pouvons faire une note de sémantique importante. Python utilise le mécanisme de redéfinition de méthode 
(method overriding), c’est-à-dire qu’on redéfinit une méthode héritée d’une classe mère. Il ne faut pas confondre cela avec la 
surcharge de fonction (function overloading) qui désigne le fait d’avoir plusieurs définitions d’une fonction selon le nombres 
d’ arguments et/ou leur type (la surcharge n’est pas supportée par Python contrairement à d’autres langages orientés objet). 


19.4.2 Ordre de résolution des noms 


Vous l’avez compris, il y aura un ordre pour la résolution des noms d’attributs ou de méthodes en fonction du ou des 
héritage(s) de notre classe (à nouveau, cela provient de la manière dont Python gère les espaces de noms). Prenons l’exemple 
d’une classe déclarée comme suit class Fille(Merel, Mere2) :. Si on invoque un attribut ou une méthode sur une instance 
de cette classe, Python cherchera d’abord dans la classe Fille. S’il ne trouve pas, il cherchera ensuite dans la première classe 
mère (Mere1 dans notre exemple). S’il ne trouve pas, il cherchera dans les ancêtres de cette première mère (si elle en a), et 
ce en remontant la filiation (d’abord la grand-mère, puis l’arrière grand-mère, etc). S’il n’a toujours pas trouvé, il cherchera 
dans la deuxième classe mère (Mere2 dans notre exemple) puis dans tous ses ancêtres. Et ainsi de suite, s’il y a plus de deux 
classes mères. Bien sûr, si aucun attribut ou méthode n’est trouvé, Python renverra une erreur. 

Il est en général possible d’avoir des informations sur l’ordre de résolution des méthodes d’une classe en évoquant la 
commande help () sur celle-ci ou une de ses instances. Par exemple, nous verrons dans le chapitre suivant le module Tkinter, 
imaginons que nous créions une instance de la classe principale du module Tkinter nommée TK : 


>>> import tkinter as tk 

>>> racine = tk.Tk() 

En invoquant la commande help(racine), l’interpréteur nous montre : 
Help on class Tk in module tkinter: 

class Tk(Misc, Wm) 


| Toplevel widget of Tk which represents mostly the main window 
of an application. It has an associated Tcl interpreter. 


| 

| 

| Method resolution order: 
| Tk 
| 

| 

| 


builtins.object 


Loss 


On voit tout de suite que la classe Tk hérite de deux autres classes Misc et Wm. Ensuite, le help indique l’ordre de résolution 
des méthodes : d’abord la classe Tk elle-méme, ensuite ses deux méres Misc puis Wm, et enfin une derniére classe nommée 
builtins.object dont nous allons voir la signification maintenant. 
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Remarque 
En Python, il existe une classe interne nommée object qui est en quelque sorte la classe ancêtre de tous les objets. Toutes 
les classes héritent de object. 


Pour vous en convaincre, nous pouvons recréer une classe vide : 


>>> class Citron: 
pass 


Puis ensuite regarder l’aide sur l’une de ses instances : 
Help on class Citron in module __main__ 


class Citron(builtins.object) 
| Data descriptors defined here: 


| 

l = diet 2 
| dictionary for instance variables (if defined) 

E: 


Laide nous montre que Citron a hérité de builtins.object bien que nous ne l’ayons pas déclaré explicitement. Cela 
se fait donc de maniére implicite. 


Remarque 
Le module builtins possède toutes les fonctions internes à Python. Il est donc pratique pour avoir une liste de toutes ces 
fonctions internes en un coup d’œil. Regardons cela avec les deux instructions import builtins puis dir(builtins) : 


>>> import builtins 
>>> dir(builtins) 


['"ArithmeticError', 'AssertionError', 'AttributeError', [...] 

‘ascii', 'bin', 'bool', 'bytearray', 'bytes', 'callable', 'chr', [...] 
'list', 'locals', 'map', 'max', 'memoryview', 'min', 'next', 'object', [...] 
istr', 'sum', 'super', 'tuple', 'type', 'vars', 'zip'] 


Au début, on y trouve les exceptions commencant par une lettre majuscule (cf. chapitre 21 Remarques complémen- 
taires pour la définition d'une exception), puis les fonctions Python de base tout en minuscule. On retrouve par exemple 
list ou str, mais il y a aussi object. Toutefois ces fonctions étant chargées de base dans l’interpréteur, l’importation de 
builtins n’est pas obligatoire : par exemple list revient au même que builtins.list,ou object revient au même que 
builtins.object. 


En résumé, la syntaxe class Citron: sera équivalente à 
class Citron(builtins.object): 
ou à class Citron(object):. 

Ainsi, même si on crée une classe Citron vide (contenant seulement une commande pass), elle possède déjà tout une 
panoplie de méthodes héritées de la classe object. Regardez l'exemple suivant : 


>>> class Citron: 


pass 

>>> c = Citron() 

>>> dir(c) 

[t crass- ty t 2delattr:_", “cedtictuo +, "zcdit-= t; to doc", "= és 
'__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', 
*__init__', '__le__', '__1t__', '__module__', '__ne__', '__new__', 
'__reduce__', ‘_.reduce_ex__', ‘__repr__', ‘..setattr__', *'__sizeof__', 

' _str__', '__subclasshook__', '__weakref__'] 

>>> o = object () 

>>> dir(o) 

Ptoselass-_"', "__delattr._", "odir "y !_-doc:_!; asedia ta !_ format: !, 
'__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__le__', 
"__it__'", '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', 
'__setattr__', '__sizeof__', '__str__', '__subclasshook__'] 


La quasi-totalité des attributs / méthodes de base de la classe Citron sont donc hérités de la classe object. Par exemple, 
lorsqu’on instancie un objet Citron c = Citron(), Python utilisera la méthode .__init__() héritée de la classe object 
(puisque nous ne l’avons pas définie dans la classe Citron). 
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19.4.3 Un exemple concret d’héritage 


Nous allons maintenant prendre un exemple un peu plus conséquent pour illustrer la puissance de l’héritage en programma- 
tion. D’abord quelques mots à propos de la conception. Imaginons que nous souhaitions créer plusieurs classes correspondant 
à nos fruits favoris, par exemple le citron (comme par hasard !), l’orange, le kaki, etc. Chaque fruit a ses propres particularités, 
mais il y a aussi de nombreux points communs. Nous pourrions donc concevoir une classe Fruit permettant, par exemple, 
d'instancier un fruit et ajouter des méthodes d’affichage commune à n'importe quel fruit, et ajouter (ou toute autre méthode) 
pouvant être utilisée pour n’importe quel fruit. Nous pourrions alors créer des classes comme Citron, Orange, etc., héritant 
de la classe Fruit et ainsi nous économiser des lignes de code identiques à ajouter pour chaque fruit. Regardons l’exemple 
suivant que nous avons garni de print () pour bien comprendre ce qui se passe : 


class Fruit: 
def __init__(self, taille=None, masse=None, saveur=None, forme=None): 


print("(2) Je suis dans le constructeur de la classe Fruit") 
self.taille = taille 


self.masse = masse 
self.saveur = saveur 
self.forme = forme 


print("Je viens de créer self.taille, self.masse, self.saveur " 


"et self.forme") 


def affiche_conseil(self, type_fruit, conseil): 
print("(2) Je suis dans la méthode .affiche_conseil() de la 
"classe Fruit\n") 
return (f"Instance {type_fruit}\n" 
f"taille: (self.taille), masse: {self.masse}\n" 
f"saveur: {self.saveur}, forme: {self.forme}\n" 
f"conseil: {conseil}\n") 


class Citron(Fruit): 


def __init__(self, taille=None, masse=None, saveur=None, forme=None): 
print("(1) Je rentre dans le constructeur de Citron, et je vais " 
“appeler\n" 
"le constructeur de la classe mère Fruit !") 
Fruit.__init__(self, taille, masse, saveur, forme) 


print ("(3) J'ai fini dans le constructeur de Citron, " 


"les attributs sont :\n" 
f"self.taille: {self.taille}, self.masse: {self.masse}\n" 
f"self.saveur: {fself.saveur}, self.forme: {self.forme}\n") 


def __str__(self): 
print("(1) Je rentre dans la méthode .__str__() de la classe 
"Citron") 
print("Je vais lancer la méthode .affiche_conseil() héritée 
"de la classe Fruit") 


" 


return self.affiche_conseil("Citron", "Bon en tarte :-p !") 
if __name__ == "__main__": 
# On crée un citron. 
citroni = Citron(taille="petite", saveur="acide", 
forme="ellipsoide", masse=50) 


print (citron1) 


Lignes 1 à 9. On crée la classe Fruit avec son constructeur qui initialisera tous les attributs d’ instance décrivant le fruit. 

Lignes 11 à 17. Création d’une méthode .affiche_conseil() qui retourne une chaîne contenant le type de fruit, les 
attributs d’instance du fruit, et un conseil de consommation. 

Lignes 20 à 29. Création de la classe Citron qui hérite de la classe Fruit. Le constructeur de Citron prend les mêmes 
arguments que ceux du constructeur de Fruit. La ligne 24 est une étape importante que nous n’avons encore jamais vue : l’ins- 
truction Fruit.__init__() est un appel au constructeur de la classe mère (cf. explications plus bas). Notez bien que le pre- 
mier argument passé au constructeur de la classe mère sera systématiquement l’instance en cours self. Le print () en lignes 
26-29 illustre qu’aprés l’appel du constructeur de la classe mère tous les attributs d'instance (self .taille, self.poids, 
etc.) ont bel et bien été créés. 

Lignes 31 à 36. On définit la méthode .__str__( qui va modifier le comportement de notre classe avec print (). Celle- 
ci fait également appel à une méthode hértitée de la classe mère nommée .affiche_conseil(). Comme on a l’a héritée, 
elle est directement accessible avec un self .méthode() (et de l’extérieur ce serait instance .méthode()). 

Lignes 39 à 43. Dans le programme principal, on instancie un objet Citron, puis on utilise print () sur l’instance. 

L’exécution de ce code affichera la sortie suivante : 


(1) Je rentre dans le constructeur de Citron, et je vais appeler 
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le constructeur de la classe mère Fruit ! 


(2) Je suis dans le constructeur de la classe Fruit 

Je viens de créer self.taille, self.masse, self.saveur et self.forme 
(3) J'ai fini dans le constructeur de Citron, les attributs sont: 
self.taille: petite, self.masse: 50 

self.saveur: acide, self.forme: ellipsoïde 


(1) Je rentre dans la méthode .__str__() de la classe Citron 
Je vais lancer la méthode .affiche_conseil() héritée de la classe Fruit 
(2) Je suis dans la méthode .affiche_conseil() de la classe Fruit 


Instance Citron 

taille: petite, masse: 50 
saveur: acide, forme: ellipsoide 
conseil: Bon en tarte :-p ! 


Prenez bien le temps de suivre ce code pas à pas pour bien en comprendre toutes les étapes. 

Vous pourrez vous poser la question « Pourquoi utilise-t-on en ligne 24 la syntaxe Fruit.__init__() ? ». Cette syntaxe 
est souvent utilisée lorsqu’une classe hérite d’une autre classe pour faire appel au constructeur de la classe mére. La raison est 
que nous souhaitons appeler une méthode de la classe mère qui a le même nom qu’une méthode de la classe fille. Dans ce cas, 
si on utilisait self.__init__(), cela correspondrait à la fonction de notre classe fille Citron. En mettant systématiquement 
une syntaxe 
ClasseMere.__init__() on indique sans ambiguité qu’on appelle le constructeur de la classe mére, en mettant expli- 
citement son nom. Ce mécanisme est assez souvent utilisé dans le module Tkinter (voir chapitre 20) pour la construction 
d'interfaces graphiques, nous en verrons de nombreux exemples. 


Remarque 
Si vous utilisez des ressources externes, il se peut que vous rencontriez une syntaxe super ().__init__(). La fonction 

Python interne super () appelle automatiquement la classe mère sans que vous ayez à donner son nom. Même si cela peut 

paraître pratique, nous vous conseillons d’ utiliser dans un premier temps la syntaxe 

ClasseMere.__init__() quiest selon nous plus lisible (on voit explicitement le nom de la classe employée, méme s’il y a 

plusieurs classes mères). 


Ce mécanisme n’est pas obligatoirement utilisé, mais il est très utile lorsqu'une classe fille a besoin d’initialiser des 
attributs définis dans la classe mère. On le croise donc souvent car : 
— Cela donne la garantie que toutes les variables de la classe mère sont bien initialisées. On réduit ainsi les risques de 
dysfonctionnement des méthodes héritées de la classe mère. 
— Finalement, autant ré-utiliser les « moulinettes » de la classe mère, c’est justement à ça que sert l’héritage ! Au final, 
on écrit moins de lignes de code. 


Conseil 
Pour les deux raisons citées ci-dessus, nous vous conseillons de systématiquement utiliser le constructeur de la classe mère 
lors de l’instanciation. 


Vous avez à présent bien compris le fonctionnement du mécanisme de l’héritage. Dans notre exemple, nous pourrions 
créer de nouveaux fruits avec un minimum d’effort. Ceux-ci pourraient hériter de la classe mère Fruit à nouveau, et nous 
n’aurions pas à réécrire les mêmes méthodes pour chaque fruit, simplement à les appeler. Par exemple : 


class Kaki(Fruit): 
def init__(self, taille=None, masse=None, saveur=None, forme=None): 


Fruit.__init__(self, taille, masse, saveur, forme) 


def __str__(self): 
return Fruit.affiche_conseil(self, "Kaki", 
"Bon à manger cru, miam !") 


class Orange(Fruit): 
def __init__(self, taille=None, masse=None, saveur=None, forme=None): 
Fruit.__init__(self, taille, masse, saveur, forme) 


def str__(self): 


return Fruit.affiche_conseil(self, "Orange", "Trop bon en jus !") 
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Cet exemple illuste la puissance de l'héritage et du polymorphisme et la facilité avec laquelle on les utilise en Python. 
Pour chaque fruit, on utilise la méthode 
.affiche_conseil() définie dans la classe mère sans avoir à la réécrire. Bien sûr cet exemple reste simpliste et n’est qu’une 
« mise en bouche ». Vous verrez des exemples concrets de la puissance de l’héritage dans le chapitre 20 Fenêtres graphiques 
et Tkinter ainsi que dans les exercices du présent chapitre. Avec le module Tkinter, chaque objet graphique (bouton, zone de 
texte, etc.) est en fait une classe. On peut ainsi créer de nouvelles classes héritant des classes Tkinter afin de personnaliser 
chaque objet graphique. 


Pour aller plus loin 

À ce stade, nous pouvons émettre deux remarques : 

L'héritage et le polymorphisme donnent toute la puissance à la POO. Toutefois, concevoir ses classes sur un projet, 
surtout au début de celui-ci, n’est pas chose aisée. Nous vous conseillons de lire d’autres ressources et de vous entraîner 
sur un maximum d'exemples. Si vous souhaitez allez plus loin sur la POO, nous vous conseillons de lire des ressources 
supplémentaires. En langue française, vous trouverez les livres de Gérard Swinnen °, Bob Cordeau et Laurent Pointal '%, et 
Vincent Legoff !!. 


19.5 Accès et modifications des attributs depuis l’extérieur 


19.5.1 Le problème 


On a vu jusqu’à maintenant que Python était très permissif concernant le changement de valeur de n’importe quel attribut 
depuis l’extérieur. On a vu aussi qu’il était même possible de créer de nouveaux attributs depuis l’extérieur ! Dans d’autres 
langages orientés objet ceci n’est pas considéré comme une bonne pratique. Il est plutôt recommandé de définir une interface, 
c’est-à-dire tout un jeu de méthodes accédant ou modifiant les attributs. Ainsi, le concepteur de la classe a la garantie que 
celle-ci est utilisée correctement du « côté client ». 


Remarque 

Cette stratégie d’utiliser uniquement l’interface de la classe pour accéder aux attributs provient des langages orientés objet 
comme Java et C++. Les méthodes accédant ou modifiant les attributs s’appellent aussi des getters et setters (en français on dit 
accesseurs et mutateurs). Un des avantages est qu’il est ainsi possible de vérifier l’intégrité des données grâce à ces méthodes : 
si par exemple on souhaitait avoir un entier seulement, ou bien une valeur bornée, on peut facilement ajouter des tests dans 
le setter et renvoyer une erreur à l’utilisateur de la classe s’il n'a pas envoyé le bon type (ou la bonne valeur dans l’intervalle 
imposé). 


Regardons à quoi pourrait ressembler une telle stratégie en Python : 


class Citron: 


def __init__(self, couleur="jaune", masse=0): 
self.couleur = couleur 
self.masse = masse # masse en g 


def get_couleur(self): 
return self.couleur 


def set_couleur(self, value): 
self.couleur = value 


def get_masse(self): 
return self.masse 


def set_masse(self, value): 
if value < 0: 
raise ValueError("Z'avez déjà vu une masse négative ???") 
self.masse = value 


if __name__ == " Mes 


__main__ 


9. https://inforef.be/swi/python.htm 
10. https://perso.limsi.fr/pointal/python:courspython3 
11. https://openclassrooms.com/fr/courses/235344-apprenez-a-programmer-en-python 
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# définition de citroni 

citroni = Citron() 

print(citroni.get_couleur(), citroni.get_masse()) 

# on change les attributs de citroni avec les setters 
citroni.set_couleur ("jaune foncé") 
citroni.set_masse (100) 

print (citron1.get_couleur(), citron1.get_masse()) 


Lignes 6 à 10. On définit deux méthodes getters pour accéder à chaque attribut. 

Lignes 12 à 18. On définit deux méthodes setters pour modifier chaque attribut. Notez qu’en ligne 16 nous testons si la 
masse est négative, si tel est le cas nous générons une erreur avec le mot-clé raise (cf. chapitre 21 Remarques complémen- 
taires). Ceci représente un des avantages des setters : contrôler la validité des attributs (on pourrait aussi vérifier qu’il s’agit 
d’un entier, etc.). 

Lignes 22 à 28. Après instanciation, on affiche la valeur des attributs avec les deux fonctions getters, puis on les modifie 
avec les setters et on les réaffiche à nouveau. 

L’exécution de ce code donnera la sortie suivante : 


jaune 0 
jaune foncé 100 


Si on avait mis citron1.set_masse(-100) en ligne 26, la sortie aurait été la suivante : 


jaune 0 
Traceback (most recent call last): 
File "./getter_setter.py", line 26, in <module> 
citroni.set_masse(-100) 
File "./getter_setter.py", line 17, in set_masse 


raise ValueError("Z'avez déjà vu une masse négative ?77") 
ValueError: Z'avez déjà vu une masse négative 7??? 


La fonction interne raise nous a permis de générer une erreur car l’utilisateur de la classe (c’est-à-dire nous dans le 
programme principal) n’a pas rentré une valeur correcte. 
On comprend bien l’utilité d’une stratégie avec des getters et setters dans cet exemple. Toutefois, en Python, on peut très 
i 7 i i é i etters setters | i é itron 
bien accéder et modifier les attributs méme si on a des getters et des setters dans la classe. Imaginons la méme classe Cit 


que ci-dessus, mais on utilise le programme principal suivant (notez que nous avons simplement ajouter les lignes 9 a 12 
ci-dessous) : 


if __name__ == "__main__": 
# définition de citroni 
citroni = Citron() 


print (citron1.get_couleur(), citroni.get_masse()) 

# on change les attributs de citroni avec les setters 
citroni.set_couleur("jaune foncé") 
citroni.set_masse (100) 


print (citron1.get_couleur(), citroni.get_masse()) 
# on les rechange sans les setters 
citroni.couleur = "pourpre profond" 

citroni.masse = -15 


print(citroni.get_couleur(), citroni.get_masse()) 


Cela donnera la sortie suivante : 


jaune 0 
jaune foncé 100 
pourpre profond -15 


Malgré la présence des getters et des setters, nous avons réussi à accéder et à modifier la valeur des attributs. De plus, nous 
avons pu mettre une valeur aberrante (masse négative) sans que cela ne génère une erreur ! 

Vous vous posez sans doute la question : mais dans ce cas, quel est l’intérêt de mettre des getters et des setters en Python ? 
La réponse est très simple : cette stratégie n’est pas une manière « pythonique » d’opérer (voir le chapitre 15 Bonnes pratiques 
en programmation Python pour la définition de « pythonique »). En Python, la lisibilité est la priorité. Souvenez-vous du Zen 
de Python « Readability counts » (voir le chapitre 15). 

De manière générale, une syntaxe avec des getters et setters du côté client surcharge la lecture. Imaginons que l’on ait une 
instance nommée obj et que l’on souhaite faire la somme de ses trois attributs x, y et z : 


# pythonique 
obj.x + obj.y + obj.z 


# non pythonique 
obj.get_x() + obj.get_y() + obj.get_z() 
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La méthode pythonique est plus « douce » à lire, on parle aussi de syntactic sugar ou littéralement en français « sucre 
syntaxique ». De plus, à l’intérieur de la classe, il faut définir un getter et un setter pour chaque attribut, ce qui multiple les 
lignes de code. 

Très bien. Donc en Python, on n’utilise pas comme dans les autres langages orientés objet les getters et les setters ? Mais, 
tout de même, cela avait l’air une bonne idée de pouvoir contrôler comment un utilisateur de la classe interagit avec certains 
attributs (par exemple, rentre-t-il une bonne valeur ?). N’existe-t-il pas un moyen de faire ça en Python? La réponse est : bien 
sûr il existe un moyen pythonique, la classe property. Nous allons voir cette nouvelle classe dans la prochaine rubrique et 
nous vous dirons comment opérer systématiquement pour accéder, modifier, voire détruire, chaque attribut d’instance de votre 
classe. 


19.5.2 La solution : la classe property 


Dans la rubrique précédente, on vient de voir que les getters et setters traditionnels rencontrés dans d’autres langages orien- 
tés objet ne représentent pas une pratique pythonique. En Python, pour des raisons de lisibilité, il faudra dans la mesure du pos- 
sible conserver une syntaxe instance.attribut pour l’accès aux attributs d'instance, et une syntaxe instance .attribut 
= nouvelle _ valeur pour les modifier. 

Toutefois, si on souhaite contrôler l’accès, la modification (voire la destruction) de certains attributs stratégiques, Python 
met en place une classe nommée property. Celle-ci permet de combiner le maintien de la syntaxe lisible instance. attribut, 
tout en utilisant en filigrane des fonctions pour accéder, modifier, voire détruire l’attribut (à l’image des getters et setters évo- 
qués ci-dessus, ainsi que des deleters ou encore destructeurs en français). Pour faire cela, on utilise la fonction Python interne 
property() qui crée un objet (ou instance) property : 


attribut = property(fget=accesseur, fset=mutateur, fdel=destructeur) 


Les arguments passés à property () sont systématiquement des méthodes dites callback, c’est-à-dire des noms de mé- 
thodes que l’on a définies précédemment dans notre classe, mais on ne précise ni argument, ni parenthèse, ni self (voir le 
chapitre 20 Fenétres graphiques et Tkinter). Avec cette ligne de code, attribut est un objet de type property qui fonctionne 
de la manière suivante à |’ extérieur de la classe : 

— P'instruction instance.attribut appellera la méthode .accesseur(). 

— L’instruction instance.attribut = valeur appellera la méthode 

.mutateur(). 
— L’instruction del instance.attribut appellera la méthode 
.destructeur(). 

L'objet attribut est de type property, et la vraie valeur de l’attribut est stockée par Python dans une variable d’ instance 
qui s’appellera par exemple _attribut (même nom mais commençant par un underscore unique, envoyant un message à 
l'utilisateur qu’il s’agit d’une variable associée au comportement interne de la classe). 

Comment cela fonctionne-t-il concrètement dans un code? Regardons cet exemple (nous avons mis des print () un peu 
partout pour bien comprendre ce qui se passe) : 


class Citron: 


def __init__(self, masse=0): 
print ("(2) J'arrive dans le .__init__()") 
self.masse = masse 


def get_masse(self): 


print ("Coucou je suis dans le get") 
return self._masse 


def set_masse(self, valeur): 
print("Coucou je suis dans le set") 
if valeur < 0: 


raise ValueError("Un citron ne peut pas avoir" 


" de masse négative !") 
self._masse = valeur 
masse = property(fget=get_masse, fset=set_masse) 
if __name__ == "__main__": 


print("(1) Je suis dans le programme principal, " 
"je vais instancier un Citron") 

citron = Citron(masse=100) 

print("(3) Je reviens dans le programme principal") 


print(f"La masse de notre citron est {citron.masse} g") 
# on mange le citron 
citron.masse = 25 


Cours de Python / Université de Paris / UFR Sciences du Vivant 205 


Chapitre 19. Avoir la classe avec les objets 19.5. Accès et modifications des attributs depuis l’extérieur 


206 


print (f"La masse de notre citron est {citron.masse} g") 
print (citron.__dict__) 


Pour une fois, nous allons commenter les lignes dans le désordre : 

Ligne 17. Il s’agit de la commande clé pour mettre en place le système : masse devient ici un objet de type property (si 
on regarde son contenu avec une syntaxe NomClasse.attribut_property, donc ici Citron.masse, Python nous renverra 
quelque chose de ce style : <property object at 0x7fd3615aeef8>). Qu’est-ce que cela signifie ? Et bien la prochaine 
fois qu’on voudra accéder au contenu de cet attribut .masse, Python appellera la méthode . get_masse (), et quand on voudra 
le modifier, Python appellera la méthode . set_masse () (ceci sera valable de l’intérieur ou de |’ extérieur de la classe). Comme 
il n’y a pas de méthode destructeur (passée avec l’argument fdel), on ne pourra pas détruire cet attribut : un del c.masse 
conduirait à une erreur de ce type : AttributeError: can't delete attribute. 

Ligne 4. Si vous avez bien suivi, cette commande self .masse = masse dans le constructeur va appeler automatiquement 
la méthode .set_masse(). Attention, dans cette commande, la variable masse à droite du signe = est une variable locale 
passée en argument. Par contre, self .masse sera l’objet de type property. Si vous avez bien lu la rubrique Différence entre 
les attributs de classe et d’instance, l’objet masse créé en ligne 16 est un attribut de classe, on peut donc y accéder avec une 
syntaxe self .masse au sein d’une méthode. 


Conseil 

Notez bien l’utilisation de self .masse dans le constructeur (en ligne 4) plutôt que self._masse. Comme self .masse 
appelle la méthode .set_masse(), cela permet de contrôler si la valeur est correcte dès l’instanciation. C’est donc une 
pratique que nous vous recommandons. Si on avait utilisé self._masse, il n’y aurait pas eu d’appel à la fonction mutateur et 
on aurait pu mettre n’importe quoi, y compris une valeur aberrante, lors de l’instanciation. 


Lignes 6 à 15. Dans les méthodes accesseur et mutateur, on utilise la variable 
self._masse qui contiendra la vraie valeur de la masse du citron (cela serait vrai pour tout autre objet de type property). 


Attention 

Dans les méthodes accesseur et mutateur il ne faut surtout pas utiliser self .masse à la place de self ._masse. Pourquoi? 
Par exemple, dans l’accesseur, si on met self .masse cela signifie que l’on souhaite accéder à la valeur de l’attribut (comme 
dans le constructeur !). Ainsi, Python rappellera l’accesseur et retombera sur self .masse, ce qui rappellera l’accesseur et 
ainsi de suite : vous l’aurez compris, cela partira dans une récursion infinie et mènera à une erreur du type RecursionError: 
maximum recursion depth exceeded. Cela serait vrai aussi si vous aviez une fonction destructeur, il faudrait utiliser 
self. _ masse). 


L’exécution de ce code donnera : 


(1) Dans le programme principal, je vais instancier un Citron 


(2) J'arrive dans le .__init__() 
Coucou je suis dans le set 


(3) Je reviens dans le programme principal 
Coucou je suis dans le get 

La masse de notre citron est 100 g 

Coucou je suis dans le set 

Coucou je suis dans le get 

La masse de notre citron est 25 g 


{'_masse': 25} 


Cette exécution montre qu’à chaque appel de self .masse ou citron.masse on va utiliser les méthodes accesseur ou 
mutateur. La dernière commande qui affiche le contenu de citron.__dict__ montre que la vraie valeur de l’attribut est 
stockée dans la variable d'instance ._ masse (instance. _ masse de l'extérieur et self ._masse de l’intérieur). 


Pour aller plus loin 

Il existe une autre syntaxe considérée comme plus élégante pour mettre en place les objets property. Il s’agit des déco- 
rateurs property, Cattribut.setter et Cattribut.deleter. Toutefois, la notion de décorateur va au-delà du présent 
ouvrage. Si vous souhaitez plus d’ informations, vous pouvez consulter par exemple le site programiz !? ou le livre de Vincent 
Legoff !°. 


12. https://www.programiz.com/python-programming/property 
13. https://openclassrooms.com/fr/courses/235344-apprenez-a-programmer-en-python 
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19.6 Bonnes pratiques pour construire et manipuler ses classes 


Nous allons voir dans cette rubrique certaines pratiques que nous vous recommandons lorsque vous construisez vos propres 
classes. 


19.6.1 L'accès aux attributs 


On a vu dans la rubrique Accès et modifications des attributs depuis l’extérieur que nous avions le moyen de contrôler 
cet accès avec la classe property. Toutefois, cela peut parfois alourdir inutilement le code, ce qui va à l’encontre de certains 
préceptes de la PEP 20 comme « Sparse is better than dense », « Readability counts », etc. (voir le chapitre 15 Bonnes 
pratiques en programmation Python). 


Conseil 

Si on souhaite contrôler ce que fait le client de la classe pour certains attributs « délicats » ou « stratégiques », on peut 
utiliser la classe property. Toutefois, nous vous conseillons de ne l’utiliser que lorsque cela se révèle vraiment nécessaire, 
donc avec parcimonie. Le but étant de ne pas surcharger le code inutilement. Cela va dans le sens des recommandations des 
développeurs de Python (comme décrit dans la PEP8). 


Les objets property ont deux avantages principaux : 

— ils permettent de garder une lisibilité du côté client avec une syntaxe 
instance.attribut; 

— même si un jour vous décidez de modifier votre classe et de mettre en place un contrôle d’accès à certains attributs 
avec des objets property, cela ne changera rien du côté client. Ce dernier utilisera toujours instance .attribut ou 
instance.attribut = valeur. Tout cela contribuera à une meilleure maintenance du code client utilisant votre 
classe. 

Certains détracteurs disent qu'il est parfois difficile de déterminer qu’un attribut est contrôlé avec un objet property. La 

réponse à cela est simple, dites-le clairement dans la documentation de votre classe via les docstrings (voir la rubrique ci- 
dessous). 


19.6.2 Note sur les attributs publics et non publics 


Certains langages orientés objet mettent en place des attributs dits privés dont l’accès est impossible de l’extérieur de 
la classe. Ceux-ci existent afin d’éviter qu’un client n’aille perturber ou casser quelque chose dans la classe. Les arguments 
auxquels l’utilisateur a accès sont dits publics. 


Attention 
En Python, il n’existe pas d’attributs privés comme dans d’autres langages orientés objet. L'utilisateur a accès à tous les 
attributs quels qu’ils soient, même s’ils contiennent un ou plusieurs caractére(s) underscore(s) (cf. ci-desssous) ! 


Au lieu de ça, on parle en Python d’attributs publics et non publics. 


Définition 
En Python les attributs non publics sont des attributs dont le nom commence par un ou deux caractère(s) underscore. Par 
exemple, _attribut,ou __attribut. 


La présence des underscores dans les noms d’attributs est un signe clair que le client ne doit pas y toucher. Toutefois, cela 
n’est qu’une convention, et comme dit ci-dessus le client peut tout de même modifier ces attributs. 

Par exemple, reprenons la classe Citron de la rubrique précédente dont l’attribut .masse est contrôlé avec un objet 
property : 


>>> citron = Citron() 
Coucou je suis dans le set 
>>> citron.masse 

Coucou je suis dans le get 
0 


>>> citron.masse = -16 
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Coucou je suis dans le set 
Traceback (most recent call last): 


File "<stdin>", line 1, in <module > 

File "<stdin>", line 10, in set_masse 
ValueError: Z'avez déja vu une masse négative ? C'est nawak 
>>> citron.masse = 16 


Coucou je suis dans le set 
>>> citron.masse 
Coucou je suis dans le get 


16 

>>> citron._masse 

16 

>>> citron._masse = -8364 


>>> citron.masse 

Coucou je suis dans le get 
-8364 

>>> 


Malgré l’objet property, nous avons pu modifier l’attribut non public ._masse directement ! 
Il existe également des attributs dont le nom commence par deux caractères underscores. Nous n’avons encore jamais 
croisé ce genre d’attribut. Ces derniers mettent en place le name mangling. 


Définition 
Le name mangling '*, ou encore substantypage ou déformation de nom en français, correspond à un mécanisme de chan- 
gement du nom d’un attribut selon si on est à l’intérieur ou à l’extérieur d’une classe. 


Regardons un exemple : 


class Citron: 
def __init__(self): 
self.__mass = 100 


def get_mass(self): 
return self.__mass 


if __name__ == "__main__": 
citroni = Citron() 
print (citron1.get_mass()) 


print (citroni.__mass) 


Ce code va donner la sortie suivante : 


100 
Traceback (most recent call last): 
File "./pyscripts/mangling.py", line 11, in <module> 
print (citroni.__mass) 
AttributeError: 'Citron' object has no attribute '__mass' 


La ligne 12 du code a donc conduit à une erreur : Python prétend ne pas connaître l’attribut .__mass. On pourrait croire 
que cela constitue un mécanisme de protection des attributs. En fait il n’en est rien, car on va voir que l’attribut est toujours 
accessible et modifiable. Si on modifiait le programme principal comme suit : 


if __name__ == "__main__": 
citroni = Citron() 
print (citroni.__dict__) 


On obtiendrait en sortie le dictionnaire {'_Citron__mass': 100}. 


Le name mangling est donc un mécanisme qui transforme le nom self .__attribut à l’intérieur de la classe en instance. 


à l’extérieur de la classe. Ce mécanisme a été conçu initialement pour pouvoir retrouver des noms d’attributs identiques lors de 
l'héritage. Si par exemple une classe mère et une classe fille ont chacune un attribut nommé __attribut, le name mangling 
permet d’éviter les conflits de nom. Par exemple : 


class Fruit: 
def __init__(self): 
self.__mass = 100 


class Citron(Fruit): 
def __init__(self): 


Fruit.__init__ (self) 
self.__mass = 200 


14. https://en.wikipedia. org/wiki/Name_mangling 
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def print _masse(self): 
print(self._Fruit__mass) 


print(self.__mass) 
if __name__ == "__main__": 
citroni = Citron() 


citroni.print_masse() 


Ce code affiche 100 puis 200. La ligne 12 a permis d’accéder à l’attribut .__mass de la classe mère Fruit, et la ligne 13 


a permis d’accéder à l’attribut .__mass de la classe Citron. 


Le name mangling n’est donc pas un mécanisme de « protection » d’un attribut, il n’a pas été conçu pour ça. Les concep- 
teurs de Python le disent clairement dans la PEP 8 : « Generally, double leading underscores should be used only to avoid 


name conflicts with attributes in classes designed to be subclassed ». 


Donc en Python, on peut tout détruire, même les attributs délicats contenant des underscores. Pourquoi Python permet-il 
un tel paradoxe ? Et bien selon le concepteur Guido van Rossum: « We’re all consenting adults here », nous sommes ici entre 


adultes, autrement dit nous savons ce que nous faisons ! 


Conseil 


En résumé, n’essayez pas de mettre des barrières inutiles vers vos attributs. Cela va à l’encontre de la philosophie Python. 


Soignez plutôt la documentation et faites confiance aux utilisateurs de votre classe ! 


19.6.3 Classes et docstrings 


Les classes peuvent bien sûr contenir des docstrings comme les fonctions et les modules. C’est d’ailleurs une pratique 


vivement recommandée. Voici un exemple sur notre désormais familière classe Citron : 


class Citron: 
"""Voici la classe Citron. 


Il s'agit d'une classe assez impressionnante qui crée des objets 


citrons. 

Par défaut une instance de Citron contient l'attribut de classe 
saveur. 

nun 

saveur = "acide" 

def __init__(self, couleur="jaune", taille="standard"): 


"Constructeur de la classe Citron. 


Ce constructeur prend deux arguments par mot-clé 
couleur et taille.""" 

self.couleur = couleur 

self.taille = taille 


def __str__(self): 
"""Redéfinit le comportement avec print().""" 


return f"saveur: {saveur}, couleur: {couleur}, taille: {taille}" 


def affiche_coucou(self): 
"""Méthode inutile qui affiche coucou.""" 


print ("Coucou !") 


Si on fait help(Citron) dans l’interpréteur, on obtient : 


Help on class Citron in module __main__ 
class Citron(builtins.object) 
| Citron(couleur='jaune', taille='standard') 


Voici la classe Citron. 


Il s'agit d'une classe assez impressionnante qui crée des objets 


| 
| 
| 
| 
| citrons. 

| Par défaut une instance de Citron contient l'attribut de classe 
| saveur. 

| 

| 

| 

| 


Methods defined here: 


__init__(self, couleur='jaune', taille='standard') 
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Constructeur de la classe Citron. 


Ce constructeur prend deux arguments par mot-clé 
couleur et taille. 


Redéfinit le comportement avec print (). 


affiche _coucou(self) 


| 
| 
| 
| 
| 
| __str__(self) 
| 
| 
| 
| Méthode inutile qui affiche coucou. 
| 


[ii] 
Data and other attributes defined here: 


saveur = 'acide' 


Python formate automatiquement l’aide comme il le fait avec les modules (voir chapitre 14 Création de modules). Comme 
nous l’avons dit dans le chapitre 15 Bonnes pratiques en programmation Python, n’oubliez pas que les docstrings sont desti- 
nées aux utilisateurs de votre classe. Elle doivent donc contenir tout ce dont un utilisateur a besoin pour comprendre ce que 
fait la classe et comment l’utiliser. 

Notez que si on instancie la classe citroni = Citron() et qu’on invoque l’aide sur l’instance help(citron1), on 
obtient la même page d’aide. Comme pour les modules, si on invoque l’aide pour une méthode de la classe 
help(citroni.affiche_ coucou), on obtient l’aide pour cette méthode seulement. 

Toutes les docstrings d’une classe sont en fait stockées dans un attribut spécial nommé instance.__doc__. Cet attribut 
est une chaîne de caractères contenant la docstring générale de la classe. Ceci est également vrai pour les modules, méthodes 
et fonctions. Si on reprend notre exemple ci-dessus : 


>>> citroni = Citron() 


>>> print(citron1.__doc__) 
Voici la classe Citron. 


Il s'agit d'une classe assez impressionnante qui crée des objets 


citrons. 
Par défaut une instance de Citron contient l'attribut de classe 
saveur. 

>>> print(citroni.affiche_coucou.__doc__) 


Méthode inutile qui affiche coucou. 


Lattribut .__doc__ est automatiquement créé par Python au moment de la mise en mémoire de la classe (ou module, 
méthode, fonction, etc.). 


19.6.4 Autres bonnes pratiques 


Voici quelques points en vrac auxquels nous vous conseillons de faire attention : 

— Une classe ne se conçoit pas sans méthode. Si on a besoin d’une structure de données séquentielles ou si on veut 
donner des noms aux variables (plutôt qu’un indice), utilisez plutôt les dictionnaires. Une bonne alternative peut être 
les namedtuples (cf. rubrique suivante). 

— Nous vous déconseillons de mettre comme paramètre par défaut une liste vide (ou tout autre objet séquentiel modi- 
fiable) : 


def __init__(self, liste=[]): 
self.liste = liste 
Si vous créez des instances sans passer d’argument lors de l’instanciation, toutes ces instances pointeront vers la même 
liste. Cela peut avoir des effets désastreux. 
— Ne mettez pas non plus une liste vide (ou tout autre objet séquentiel modifiable) comme attribut de classe. 


class Citron: 
liste = [] 


Ici chaque instance pourra modifier la liste, ce qui n’est pas souhaitable. Souvenez vous, la modification des attributs de 
classe doit se faire par une syntaxe Citron.attribut = valeur (et non pas via les instances). 
— Comme abordé dans la rubrique Différence entre les attributs de classe et d’instance, nous vous conseillons de ne 
jamais modifier les attributs de classe. Vous pouvez néanmois les utiliser comme constantes. 


— Si vous avez besoin d’ attributs modifiables, utilisez des attributs d'instance et initialisez les dans la méthode .__init__() 


(et nulle part ailleurs). Par exemple, si vous avez besoin d’une liste comme attribut, créez la plutôt dans le constructeur : 
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class Citron: 
def __init__(self): 
self.liste = [] 


Ainsi, vous aurez des listes réellement indépendantes pour chaque instance. 


19.6.5 Pour finir les namedtuples 


Imaginons que l’on souhaite stocker des éléments dans un container, que l’on puisse retrouver ces éléments avec une 
syntaxe container .element et que ces éléments soit non modifiables. On a vu ci-dessus, les classes ne sont pas faites pour 
cela, il n’est pas conseillé de les utiliser comme des containers inertes, on les congoit en général afin d’y créer aussi des 
méthodes. Dans ce cas, les namedtuples |? sont faits pour vous ! Ce type de container est issu du très utile module collections 


que nous avions évoqué au Chapitre 13 Dictionnaires, tuples et sets. 


>>> import collections 
>>> Citron = collections.namedtuple("Citron", 
>>> Citron 


<class '__main__.Citron'> 


"masse couleur saveur forme") 


>>> citron = Citron(10, "jaune", "acide", "ellipsoide") 
>>> citron 
Citron(masse=10, couleur='jaune', saveur='acide', forme='ellipsoide ') 


>>> citron.masse 
10 

>>> citron.forme 
'ellipsoide' 


Lignes 2 a 4. La fonction namedtuple () renvoie une classe qui sert á créer de nouveaux objets citrons. Attention cette 
classe est différente de celles que l’on a rencontrées jusqu’à maintenant, car elle hérite de la classe builtins . tuple (on peut 
le voir en faisant help(Citron)). En ligne 2, on passe en argument le nom de la classe souhaitée (i.e. Citron), puis une 
chaîne de caractères avec des mots séparés par des espaces qui correspondront aux attributs (on pourrait aussi passer une liste 


["masse", "couleur", "saveur", "forme"]). 
Ligne 5. On instancie un nouvel objet citron. 


Lignes 6 à 11. On peut retrouver les différents attributs avec une syntaxe instance.attribut. 
Mais dans namedtuple, il y a tuple! Ainsi, instance citron hérite de tous les attributs des tuples : 


>>> citron[o0] 
10 
>>> citron[3] 
'ellipsoide' 
>>> citron.masse = 100 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
AttributeError: can't set attribute 
>>> for elt in citron: 
print(elt) 
10 
jaune 
acide 
ellipsoide 


Lignes 1 a 4. On peut retrouver les attributs également par indice. 
Lignes 5 a 8. Les attributs / éléments sont non modifiables ! 
Lignes 9 a 15. Les namedtuples sont itérables. 


Enfin, il est possible de convertir un namedtuple en dictionnaire (ordonné) avec la méthode ._asdict() : 


>>> citron._asdict() 


OrderedDict([('masse', 10), ('couleur', 'jaune'), 


('saveur', 'acide'), 


('forme', 'ellipsoide')]) 


Quand utiliser les namedtuples ? Vous souvenez-vous de la différence entre les listes et les dictionnaires ? Et bien là c’est 
un peu la même chose entre les tuples et les namedtuples. Les namedtuples permettent de créer un code plus lisible en 
remplaçant des numéros d’indice par des noms. Le fait qu’ils soient non modifiables peut aussi avoir un avantage par rapport 
à l’intégrité des données. Si vous trouvez les namedtuples limités, sachez que vous pouvez créer votre propre classe qui hérite 


d'un namedtuple afin de lui ajouter de nouvelles méthodes « maison ». 


Pour aller plus loin 


15. https://docs.python.org/fr/3/library/collections.html#collections.namedtuple 
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Pour aller plus loin, vous pouvez consulter le très bon article !° de Dan Bader. 


19.7 Exercices 


Conseil : pour ces exercices, créez des scripts puis exécutez-les dans un shell. 


19.7.1 Classe Rectangle 


Téléchargez le script rectangle.py |” qui implémente la classe Rectangle. 

Complétez le programme principal pour que le script : 

— crée une instance rectangle de la classe Rectangle; 

— affiche les attributs d’instance largeur, longueur et couleur; 

— calcule et affiche la surface de rectangle; 

— affiche une ligne vide; 

— change le rectangle en carré de 30 m de côté; 

— calcule et affiche la surface de ce carré; 

— crée une autre instance rectangle? aux dimensions et à la couleur que vous souhaitez (soyez créatif !) et qui affiche 
les attributs et la surface de ce nouveau rectangle. 


19.7.2 Classe Rectangle améliorée 


Entraînez-vous avec la classe Rectangle. Créez la méthode calcule_perimetre() qui calcule le périmètre d’un objet 
rectangle. Testez sur un exemple simple (largeur = 10 m, longueur = 20 m). 


19.7.3 Classe Atome 


Créez une nouvelle classe Atome avec les attributs x, y, z (qui contiennent les coordonnées atomiques) et la méthode 
calcul_distance() qui calcule la distance entre deux atomes. Testez cette classe sur plusieurs exemples. 


19.7.4 Classe Atome améliorée 


Améliorez la classe Atome en lui ajoutant un nouvel attribut masse qui correspond à la masse atomique ainsi qu’une 
nouvelle méthode 
.calcule_centre_masse(). Redéfinissez le comportement avec print () (à l’aide de la méthode magique .__str__()) 
de manière à afficher les coordonnées et la masse de l’atome. 


19.7.5 Autres exercices +++ 


D’autres exercices plus approfondis sur les classes sont accessibles sur notre site internet '*. N'hésitez pas à aller le visiter. 


16. https://dbader.org/blog/writing-clean-python-with-namedtuples 
17. https://python.sdv.univ-paris-diderot.fr/data-files/rectangle.py 
18. https://python.sdv.univ-paris-diderot.fr/livre-dunod 
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Fenêtres graphiques et Tkinter 


Conseil 

Dans ce chapitre, nous allons utiliser des classes, nous vous conseillons de bien relire le chapitre 19 sur le sujet. Par 
ailleurs, nous vous conseillons de relire également la rubrique Arguments positionnels et arguments par mot-clé du chapitre 9 
sur les fonctions. 


20.1 Utilité d’une GUI 


Dans votre carrière « pythonesque » il se peut que vous soyez amené à vouloir développer une application graphique, on 
parle encore de graphical user interface ou GUI. Jusqu’à maintenant, vous avez fait en sorte qu’un utilisateur interagisse avec 
votre code via la ligne de commande, par exemple : 


$ python mon_script.py file.gbk blabla blublu 


Les arguments passés à la ligne de commande sont tout à fait classiques dans le monde de la bioinformatique. Toutefois, 
il se peut que vous développiez un programme pour une communauté plus large, qui n’a pas forcément l’habitude d’utiliser 
un shell et la ligne de commande. Une GUI permettra un usage plus large de votre programme, il est donc intéressant de 
regarder comment s’y prendre. Dans notre exemple ci-dessus on pourrait par exemple développer une interface où l’utilisateur 
choisirait le nom du fichier d’entrée par l’intermédiaire d’une boîte de dialogue, et de contrôler les options en cliquant sur des 
boutons, ou des « listes de choix ». Une telle GUI pourrait ressembler à la figure 20.1. 


X Ma super GUI pour mon_script.py = o x 
[ei s'affichera la sortie Ouvrir fichier 
option 1 


option 2 
blublu 
blublu2 
blublu3 


Quitter 


FIGURE 20.1 — Exemple de GUI. 
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Au dela de l’aspect convivial pour l’utilisateur, vous pourrez, avec une GUI, construire des fenêtres illustrant des éléments 
que votre programme génère à la volée. Ainsi, vous « verrez » ce qui se passe de manière explicite et en direct! Par exemple, 
si on réalise une simulation de particules, on a envie de voir un « film » des particules en mouvement, c’est-à-dire comment 
ces particules bougent au fur et à mesure que les pas de simulation avancent. Une GUI vous permettra une telle prouesse ! 
Enfin, sachez que certains logiciels scientifiques ont été développés avec la bibliothèque graphique TK (par exemple pymol, 
vmd, etc.). Qui sait, peut-être serez-vous le prochain développeur d’un outil incontournable ? 

Il existe beaucoup de modules pour construire des applications graphiques. Par exemple : Tkinter !, wxpython ?, PyQt*, 
PyGObject*, etc. Nous présentons dans ce chapitre le module Tkinter qui est présent de base dans les distributions Python (pas 
besoin a priori de faire d’installation de module externe). Tkinter permet de piloter la bibliothèque graphique Tk (Tool Kit), 
Tkinter signifiant tk interface. On pourra noter que cette bibliothèque Tk peut être également pilotée par d’autres langages 
(Tcl, perl, etc.). 


20.2 Quelques concepts liés à la programmation graphique 


Lorsque l’on développe une GUI, nous créons une fenêtre graphique contenant notre application, ainsi que des widgets 
inclus dans la fenétre. 


Définition 

Les widgets (window gadget) sont des objets graphiques permettant à l'utilisateur d’ interagir avec votre programme Python 
de maniére conviviale. Par exemple, dans la fenétre sur la figure 20.1, les boutons, les listes de choix, ou encore la zone de 
texte sont des widgets. 


L'utilisation d’une GUI va amener une nouvelle manière d’aborder le déroulement d’un programme, il s’agit de la pro- 
grammation dite « événementielle ». Jusqu’a maintenant vous avez programmé « linéairement », c’est-à-dire que les instruc- 
tions du programme principal s’enchainaient les unes derrière les autres (avec bien sûr de possibles appels à des fonctions). 
Avec une GUI, l’exécution est décidée par l'utilisateur en fonction de ses interactions avec les différents widgets. Comme c’est 
l'utilisateur qui décide quand et où il clique dans l’interface, il va falloir mettre en place ce qu’on appelle un « gestionnaire 
d’événements ». 


Définition 

Le gestionnaire d’événements est une sorte de « boucle infinie » qui est à l’affût de la moindre action de la part de 
Putilisateur. C’est lui qui effectuera une action lors de l’interaction de l’utilisateur avec chaque widget de la GUI. Ainsi, 
l’exécution du programme sera réellement guidée par les actions de l’utilisateur. 


La bibliothèque Tk que nous piloterons avec le module Python Tkinter propose tous les éléments cités ci-dessus (fenêtre 
graphique, widgets, gestionnaire d’événements). Nous aurons cependant besoin d’une derniére notion : les fonctions callback. 


Définition 
Une fonction callback est une fonction passée en argument d’une autre fonction. 


Un exemple de fonction callback est présenté dans la rubrique suivante. 


20.3 Notion de fonction callback 


Conseil : pour les débutants, vous pouvez passer cette rubrique. 
Jusqu’a maintenant nous avons toujours appelé les fonctions ou les méthodes de cette maniére : 


. https: //wiki.python.org/moin/TkInter 

. http: //www.wxpython.org/ 

. https: //pyqt.readthedocs.io 

. https://pygobject.readthedocs.io/en/latest/ 


EE © D 
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Python 3.6 Print output (drag lower right corner to resize) 


Je suis au début de une fct() et je vais exé 


def fct_callback(arg): 


print ("J'aime bien les {} !".format(arg)) 
< > 
def une_fct (ma_callback) : 4 
print ("Je suis au début de une fct() et je vais exéc Frames Objects 
= ma callback ("fraises") 
a. . Global frame function 
print("Aye, une fct() se termine.") fot_callback(arg) 
fct_callback 
# prog principal une_fct function 
une fct(fct callback) une fct (ma callback) 
< > une fet 
Edit this code ma_callback 


line that has just executed 
=> next line to execute 


FIGURE 20.2 — Exemple de fonction callback dans Python Tutor. 


var = fct(argi, arg2) 


obj .methode (arg) 


ou les arguments étaient des objets « classiques » (par exemple une chaine de caractéres, un entier, un float, etc.). 
Sachez qu'il est possible de passer en argument une fonction à une autre fonction ! Par exemple : 


def fct_callback(arg): 
print(f"J'aime bien les {arg} !") 


def une_fct(ma_callback): 
print("Je suis au début de une_fct(), " 
"et je vais exécuter la fonction callback :") 
ma_callback("fraises") 
print("une_fct() se termine.") 


if __name__ == " "a 


une_fct(fct_callback) 


Si on exécute ce code, on obtient : 


Je suis au début de une_fct() et je vais exécuter la fonction callback 
J'aime bien les fraises ! 
une_fct() se termine. 


Vous voyez que dans le programme principal, lors de l’appel de une_fct(), on lui passe comme argument une autre 
fonction mais sans aucune parenthèses ni argument, c’est-à-dire fct_callback tout court. En d’autres termes, cela est 
différent de 
une_fct(fct_callback("scoubidous")). 

Dans une telle construction, fct_callback("scoubidous") serait d’abord évaluée, puis ce serait la valeur renvoyée par 
cet appel qui serait passée à une_fct() (n’essayez pas sur notre exemple car cela ménerait à une erreur !). Que se passe-t-il en 
filigrane lors de l’appel une_fct(fct_callback) ? Python passe une référence vers la fonction fct_callback (en réalité 
il s’agit d’un pointeur, mais tout ceci est géré par Python et est transparent pour l’utilisateur). Vous souvenez-vous ce qui se 
passait avec une liste passée en argument à une fonction (voir le chapitre 12)? C’était la même chose, une référence était 
envoyée plutôt qu’une copie. Python Tutor? nous confirme cela (cf. figure 20.2). 

Lorsqu'on est dans une_fct() on pourra utiliser bien sûr des arguments lors de l’appel de notre fonction callback si on le 
souhaite. Notez enfin que dans une_fct() la fonction callback reçue en argument peut avoir un nom différent (comme pour 
tout type de variable). 

À quoi cela sert-il? A première vue cette construction peut sembler ardue et inutile. Toutefois, vous verrez que dans le 
module Tkinter les fonctions callback sont incontournables. En effet, on utilise cette construction pour lancer une fonction lors 
de l’interaction de l'utilisateur avec un widget : par exemple, lorsque l'utilisateur clique sur un bouton et qu’on souhaite lancer 
une fonction particulière suite à ce clic. Notez enfin que nous les avons déjà croisées avec les objets property (cf. chapitre 
19 Avoir la classe avec les objets). 


5. http://pythontutor.com 
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20.4 Prise en main du module Tkinter 


Le module Tkinter est très vaste. Notre but n’est pas de vous faire un cours exhaustif mais plutôt de vous montrer quelques 
pistes. Pour apprendre à piloter ce module, nous pensons qu'il est intéressant de vous montrer des exemples. Nous allons donc 
en présenter quelques-uns qui pourraient vous être utiles, à vous ensuite de consulter de la documentation supplémentaire si 
vous souhaitez aller plus loin (cf. la rubrique Bibliographie pour aller plus loin). 


20.4.1 Un premier exemple dans l’interpréteur 


Commençons par construire un script qui affichera une simple fenêtre avec un message et un bouton. Regardons d’abord 
comment faire dans l’interpréteur (nous vous conseillons de tester ligne par ligne ce code tout en lisant les commentaires 
ci-dessous) : 


>>> import tkinter as tk 


>>> racine = tk.Tk() 
>>> label = tk.Label(racine, text="J'adore Python !") 
>>> bouton = tk.Button(racine, text="Quitter", fg="red", 


sot command=racine.destroy) 
>>> label. pack() 
>>> bouton. pack () 
>>> 


Ligne 2. On crée la fenêtre principale (vous la verrez apparaître !). Pour cela, on crée une instance de la classe tk. Tk dans 
la variable racine. Tous les widgets que l’on créera ensuite seront des fils de cette fenêtre. On pourra d’ailleurs noter que cette 
classe tk.Tk ne s’instancie en général qu’une seule fois par programme. Vous pouvez, par curiosité, lancer une commande 
dir (racine) ou help(racine), vous verrez ainsi les très nombreuses méthodes et attributs associés à un tel objet Tk. 

Ligne 3. On crée un label, c’est-à-dire une zone dans la fenêtre principale où on écrit un texte. Pour cela, on a créé 
une variable label qui est une instance de la classe tk.Label. Cette variable label contient donc notre widget, nous la 
réutiliserons plus tard (par exemple pour placer ce widget dans la fenêtre). Notez le premier argument positionnelracine 
passé à la classe tk.Label, celui-ci indique la fenêtre parente où doit être dessinée le label. Cet argument doit toujours être 
passé en premier et il est vivement conseillé de le préciser. Nous avons passé un autre argument avec le nom text pour 
indiquer, comme vous l’avez deviné, le texte que nous souhaitons voir dans ce label. La classe tk.Label peut recevoir de 
nombreux autres arguments, en voici la liste exhaustive ©. Dans les fonctions Tkinter qui construisent un widget, les arguments 
possibles pour la mise en forme de celui-ci sont nombreux, si bien qu’ils sont toujours des arguments par mot-clé. Si on ne 
précise pas un de ces arguments lors de la création du widget, l’argument prendra alors une valeur par défaut. Cette liste 
des arguments par mot-clé est tellement longue qu’en général on ne les précisera pas tous. Heureusement, Python autorise 
l’utilisation des arguments par mot-clé dans un ordre quelconque. Comme nous l’avons vu dans le chapitre 9 Fonctions, 
souvenez vous que leur utilisation dans le désordre implique qu’il faudra toujours préciser leur nom : par exemple vous écrirez 
text="blabla" et non pas "blabla" tout court. 

Ligne 4. De même, on crée un bouton « Quitter » qui provoquera la fermeture de la fenêtre et donc l’arrêt de l’application 
si on clique dessus. À nouveau, on passe la fenêtre parente en premier argument, le texte à écrire dans le bouton, puis la 
couleur de ce texte. Le dernier argument command=racine.destroy va indiquer la fonction / méthode à exécuter lorsque 
l'utilisateur clique sur le bouton. On pourra noter que l’instance de la fenêtre mère tk .Tk (que nous avons nommée racine) 
possède une méthode .destroy() qui va détruire le widget sur lequel elle s’applique. Comme on tue la fenêtre principale (que 
l’on peut considérer comme un widget contenant d’autres widgets), tous les widgets fils seront détruits et donc l’application 
s’arrêtera. Vous voyez par ailleurs que cette méthode racine .destroy est passée à l’argument command= sans parenthèses 
ni arguments : il s’agit donc d’une fonction callback comme expliqué ci-dessus. Dans tous les widgets Tkinter, on doit 
passer à l’argument command=... une fonction / méthode callback. La liste exhaustive des arguments possibles de la classe 
tk.Button se trouve ici”. 

Lignes 6 et 7. Vous avez noté que lors de la création de ce label et de ce bouton, rien ne s’est passé dans la fenêtre. C’est 
normal, ces deux widgets existent bien, mais il faut maintenant les placer à l’intérieur de la fenêtre. On appelle pour ça la 
méthode .pack(), avec une notation objet widget .pack() : à ce moment précis, vous verrez votre label apparaître ainsi que 
la fenêtre qui se redimensionne automatiquement en s’adaptant à la grandeur de votre label. L’ invocation de la même méthode 
pour le bouton va faire apparaître celui-ci juste en dessous du label et redimensionner la fenêtre. Vous l’aurez compris la 
méthode .pack() place les widgets les uns en dessous des autres et ajuste la taille de la fenêtre. On verra plus bas que l’on 
peut passer des arguments à cette méthode pour placer les widgets différemment (en haut, à droite, à gauche). 

Au final, vous devez obtenir une fenêtre comme sur la figure 20.3. 


6. http://infohost.nmt.edu/tcc/help/pubs/tkinter/web/label.html 
7. http://infohost.nmt.edu/tcc/help/pubs/tkinter/web/button.html 
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X 


J'adore Python ! 
Quitter 


FIGURE 20.3 — Exemple basique de fenêtre Tkinter. 


20.42 Le même exemple dans un script. 


Tentons maintenant de faire la même chose dans un script tk_exemple.py : 


import tkinter as tk 


racine = tk.Tk() 

label = tk.Label(racine, text="J'adore Python !") 

bouton = tk.Button(racine, text="Quitter", command=racine.quit) 
bouton["fg"] = "red" 

label. pack () 

bouton. pack () 

racine.mainloop() 

print("C'est fini !") 


puis lançons ce script depuis un shell : 


$ python tk_exemple.py 


Vous voyez maintenant la même fenêtre avec les mêmes fonctionnalités par rapport à la version dans l’interpréteur (voir 
la figure 20.3). Nous commentons ici les différences (dans le désordre) : 

Ligne 6. Le bouton a été créé en ligne 5, mais on voit qu'il est possible de préciser une option de rendu du widget après 
cette création (ici on met le texte en rouge avec l’option "fg"). La notation ressemble à celle d’un dictionnaire avec une 
syntaxe générale widget ["option"] = valeur. 

Ligne 9. L’instruction racine .mainloop() va lancer le gestionnaire d'événements que nous avons évoqué ci-dessus. 
C’est lui qui interceptera la moindre action de l’utilisateur, et qui lancera les portions de code associées à chacune de ses 
actions. Bien sûr, comme nous développerons dans ce qui va suivre toutes nos applications Tkinter dans des scripts (et non 
pas dans l’interpréteur), cette ligne sera systématiquement présente. Elle sera souvent à la fin du script, puisque, à l’image 
de ce script, on écrit d’abord le code construisant l’interface, et on lance le gestionnaire d’événements une fois l’interface 
complètement décrite, ce qui lancera au final l’application. 

Ligne 10. Cette ligne ne s’exécute qu'après l’arrêt de l’application (soit en cliquant sur le bouton « Quitter », soit en 
cliquant sur la croix). 

Ligne 5. Pour quitter l’application, on utilise ici la méthode .quit (). Celle-ci casse la .mainloop() et arrête ainsi le 
gestionnaire d'événements. Cela mène à l’arrêt de l’application. Dans le premier exemple dans l’interpréteur, on avait utilisé 
la méthode .destroy() sur la fenêtre principale. Comme son nom l’indique, celle-ci détruit la fenêtre principale et mène 
aussi à l’arrêt de l’application. Cette méthode aurait donc également fonctionné ici. Par contre, la méthode .quit () n’aurait 
pas fonctionné dans l’interpréteur car, comme on l’a vu, la boucle .mainloop() n’y est pas présente. Comme nous écrirons 
systématiquement nos applications Tkinter dans des scripts, et que la boucle .mainloop() y est obligatoire, vous pourrez 
utiliser au choix .quit () ou .destroy() pour quitter l’application. 


20.5 Construire une application Tkinter avec une classe 


De manière générale, il est vivement conseillé de développer ses applications Tkinter en utilisant une classe. Cela présente 
l’avantage d’encapsuler l’ application de manière efficace et d’éviter ainsi l’utilisation de variables globales. Souvenez-vous, 
elles sont à bannir définitivement! Une classe crée un espace de noms propre à votre application, et toutes les variables 
nécessaires seront ainsi des attributs de cette classe. Reprenons notre petit exemple avec un label et un bouton : 


import tkinter as tk 


class Application(tk.Tk): 
def __init__(self): 
tk.Tk.__init__(self) 
self.creer_widgets() 
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def creer_widgets (self): 
self.label = tk.Label(self, text="J'adore Python !") 
self.bouton = tk.Button(self, text="Quitter", command=self.quit) 
self.label.pack() 
self.bouton.pack() 


if __name__ == "__main__": 


app = Application() 
app.title("Ma Première App :-)") 
app.mainloop() 


Ligne 3. On crée notre application en tant que classe. Notez que cette classe porte un nom qui commence par une majuscule 
(comme recommandé dans les bonnes pratiques de la PEP8 *, cf. chapitre 15). L'argument passé dans les parenthèses indique 
que notre classe Application hérite de la classe tk.Tk. Par ce mécanisme, nous héritons ainsi de toutes les méthodes et 
attributs de cette classe mère, mais nous pouvons en outre en ajouter de nouvelles/nouveaux (on parle aussi de « redéfinition 
» de la classe tk.Tk)! 

Ligne 4. On crée un constructeur, c’est-à-dire une méthode qui sera exécutée lors de l’instanciation de notre classe (à la 
ligne 16). 

Ligne 5. On appelle ici le constructeur de la classe mère tk. Tk. __init__(). Pourquoi fait-on cela? On se souvient dans 
la version linéaire de l’application, on avait utilisé une instanciation classique : racine = tk.Tk(). Ici, l’effet de l’appel 
du constructeur de la classe mére permet d’instancier la fenétre Tk dans la variable self directement. C’est-a-dire que la 
prochaine fois que l’on aura besoin de cette instance (lors de la création des widgets par exemple, cf. lignes 9 et 10), on 
utilisera directement self plutôt que racine ou tout autre nom donné à l’instance. Comme vu dans le chapitre 19 Avoir la 
classe avec les objets, appeler le constructeur de la classe mère est une pratique classique lorsqu’une classe hérite d’une autre 
classe. 

Ligne 6. On appelle la méthode self .creer_widgets() de notre classe Application. Pour rappel, le self avant le 
.creer_widgets() indique qu’il s’agit d’une méthode de notre classe (et non pas d’une fonction classique). 

Ligne 8. La méthode . creer_widgets() va créer des widgets dans |’ application. 

Ligne 9. On crée un label en instanciant la classe tk. Label (). Notez que le premier argument passé est maintenant self 
(au lieu de racine précédemment) indiquant la fenétre dans laquelle sera construit ce widget. 

Ligne 10. De même on crée un widget bouton en instanciant la classe tk.Button(). La aussi, l’appel à la méthode 
.quit () se fait par self .quit puisque la fenêtre est instanciée dans la variable self. Par ailleurs, on ne met ni parenthèses 
ni arguments à self . quit car il s’agit d’une fonction callback (comme dans la rubrique précédente). 

Lignes 11 et 12. On place les deux widgets dans la fenêtre avec la méthode . pack(). 

Ligne 15. Ici on autorise le lancement de notre application Tkinter en ligne de commande (python tk_application.py), 
ou bien de réutiliser notre classe en important tk_application.py en tant que module (import tk_application) (voir 
le chapitre 14 Création de modules). 

Ligne 16. On instancie notre application. 

Ligne 17. On donne un titre dans la fenêtre de notre application. Comme on utilise de petits widgets avec la méthode 
pack(), il se peut que le titre ne soit pas visible lors du lancement de l’application. Toutefois, si on « étire » la fenêtre à la 
souris, le titre le deviendra. On pourra noter que cette méthode .title() est héritée de la classe mère TKk. 

Ligne 18. On lance le gestionnaire d'événements. 

Au final, vous obtiendrez le même rendu que précédemment (cf. figure 20.3). Alors vous pourrez-vous poser la question, 
« pourquoi ai-je besoin de toute cette structure alors que le code précédent semblait plus direct? ». La réponse est simple, 
lorsqu'un projet de GUI grossit, le code devient très vite illisible s’il n’est pas organisé en classe. De plus, la non-utilisation de 
classe rend quasi-obligatoire l’utilisation de variables globales, ce qui on l’a vu, est à proscrire définitivement ! Dans la suite 
du chapitre, nous verrons quelques exemples qui illustrent cela (cf. la rubrique suivante). 


20.6 Le widget canvas 


20.6.1 Un canvas simple et le système de coordonnées 


Le widget canvas? de Tkinter est très puissant. Il permet de dessiner des formes diverses (lignes, cercles, etc.), et même 
de les animer ! 


8. https://www.python.org/dev/peps/pep-0008/ 
9. http://infohost.nmt.edu/tcc/help/pubs/tkinter/web/canvas.html 
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0,200 200,200 


FIGURE 20.4 — Exemple 1 de canvas avec le système de coordonnées. Le système de coordonnées est montré en vert et 
n'apparaît pas sur la vraie fenêtre Tkinter. 


La classe tk.Canvas crée un widget canvas (ou encore canevas en français). Cela va créer une zone (i.e. le canevas en 
tant que tel) dans laquelle nous allons dessiner divers objets tels que des ellipses, lignes, polygones, etc., ou encore insérer 
du texte ou des images. Regardons tout d’abord un code minimal qui construit un widget canvas, dans lequel on y dessine un 
cercle et deux lignes : 


import tkinter as tk 


racine = tk.Tk() 

canv = tk.Canvas(racine, bg="white", height=200, width=200) 
canv.pack() 

canv.create_oval(0, 0, 200, 200, outline="red", width=10) 
canv.create_line(0, 0, 200, 200, fill="black", width=10) 
canv.create_line(0, 200, 200, O, fill="black", width=10) 
racine.mainloop() 


Ligne 4. On voit qu'il faut d’abord créer le widget canvas, comme d’habitude en lui passant l'instance de la fenêtre 
principale en tant qu'argument positionnel, puis les options. Notons que nous lui passons comme options la hauteur et la 
largeur du canvas. Même s’il s’agit d’arguments par mot-clé, donc optionnels, c’est une bonne pratique de les préciser. En 
effet, les valeurs par défaut risqueraient de nous mener à dessiner hors de la zone visible (cela ne génère pas d’erreur mais n’a 
guère d’intérêt). 

Ligne 6 à 8. Nous dessinons maintenant des objets graphiques à l’intérieur du canevas avec les méthodes . create_oval () 
(dessine une ellipse) et .create_line() (dessine une ligne). Les arguments positionnels sont les coordonnées de l’ellipse 
(les deux points englobant l’ellipse, cf. ce lien !° pour la définition exacte) ou de la ligne. Ensuite, on passe comme d'habitude 
des arguments par mot-clé (vous commencez à avoir l’ habitude !) pour mettre en forme ces objets graphiques. 

Le rendu de l’image est montré dans la figure 20.4 ainsi que le système de coordonnées associé au canvas. Comme dans 
la plupart des bibliothèques graphiques, l’origine du repère du canvas (i.e. la coordonnée (0,0)) est en haut à gauche. Les x 
vont de gauche à droite, et les y vont de haut en bas. 


Attention 


L’axe des y est inversé par rapport à ce que l’on représente en mathématique. Si on souhaite représenter une fonction 
mathématique (ou tout autre objet dans un repère régi par un repère mathématique), il faudra faire un changement de repère. 


10. http://infohost.nmt.edu/tcc/help/pubs/tkinter/web/create_oval.html 
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X Mon Canevas Psychédélique ! — O x 
Cercle ! 


Lignes ! 


Quitter 


in, —. 


FIGURE 20.5 — Exemple 2 de canvas. 


20.6.2 Un canvas encapsulé dans une classe 


Voici un exemple un peu plus conséquent d'utilisation du widget canvas qui est inclus dans une classe. Il s’agit d'une 
application dans laquelle il y a une zone de dessin, un bouton dessinant des cercles, un autre des lignes et un dernier bouton 
qui quitte l’application (figure 20.5). 

Le code suivant crée une telle application : 


import tkinter as tk 
import random as rd 


class AppliCanevas(tk.Tk): 
def __init__(self): 
tk.Tk.__init__(self) 
self.size = 500 
self.creer_widgets () 


def creer_widgets(self): 
# création canevas 
self.canv = tk.Canvas(self, bg="light gray", height=self.size, 
width=self.size) 


self.canv.pack(side=tk. LEFT) 
# boutons 


self.bouton_cercles = tk.Button(self, text="Cercle !", 
command=self.dessine_cercles) 

self .bouton_cercles.pack(side=tk.TOP) 

self.bouton_lignes = tk.Button(self, text="Lignes !", 
command=self.dessine_lignes) 

self .bouton_lignes.pack() 

self.bouton_quitter = tk.Button(self, text="Quitter", 
command=self.quit) 

self .bouton_quitter.pack(side=tk. BOTTOM) 


def rd_col(self): 
return rd.choice(("black", "red", "green", "blue", "yellow", "magenta", 
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"cyan" , "white", " purple ")) 


def dessine_cercles(self): 
for i in range(20): 
x, y = [rd.randint(1, self.size) for j in range(2)] 
diameter = rd.randint(1, 50) 
self.canv.create_oval(x, y, xtdiameter, y+diameter, 
fill=self.rd_col()) 


def dessine_lignes(self): 
for i in range(20): 
x, y, x2, y2 = [rd.randint(1, self.size) for j in range(4)] 
self.canv.create_line(x, y, x2, y2, fill=self.rd_col()) 


if __name__ == "__main__": 
app = AppliCanevas() 
app.title("Mon Canevas Psychédélique !") 


app.mainloop() 


Lignes 4 à 6. Comme montré dans la rubrique Construire une application Tkinter avec une classe, notre classe AppliCanevas 


hérite de la classe générale tk.Tk et la fenêtre Tk se retrouve dans la variable self. 

Ligne 7. On crée un attribut de la classe self.size qui contiendra la taille (hauteur et largeur) du canvas. On rappelle 
que cet attribut sera visible dans l’ensemble de la classe puisqu’il est « accroché » à celle-ci par le self. 

Ligne 8. On lance la méthode .creer_widgets() (qui est elle aussi « accrochée » à la classe par le self). 

Lignes 12 à 14. On crée un widget canvas en instanciant la classe tk.Canvas. On place ensuite le canvas dans la fenêtre 
avec la méthode .pack() en lui précisant où le placer avec la variable Tkinter tk.LEFT. 

Lignes 15 à 24. On crée des widgets boutons et on les place dans la fenêtre. À noter que chacun de ces widgets appelle une 
méthode différente, dont deux que nous avons créées dans la classe (.dessine_cercle() et .dessine_lignes()). 

Ligne 26 à 28. Cette méthode renvoie une couleur au hasard sous forme de chaîne de caractères. 

Lignes 30 à 40. On définit deux méthodes qui vont dessiner des paquets de 20 cercles (cas spécial d’une ellipse) ou 20 
lignes aléatoires. Lors de la création de ces cercles et lignes, on ne les récupère pas dans une variable car on ne souhaite ni les 
réutiliser ni changer leurs propriétés par la suite. Vous pourrez noter ici l’avantage de programmer avec une classe, le canvas 
est directement accessible dans n'importe quelle méthode de la classe avec self .canv (pas besoin de le passer en argument 
ou de créer une variable globale). 


20.6.3 Un canvas animé dans une classe 


Dans ce dernier exemple, nous allons illustrer la puissance du widget canvas en vous montrant que l’on peut animer les 
objets se trouvant à l’intérieur. Nous allons également découvrir une technique intéressante, à savoir, comment « intercepter » 


des clics de souris générés ou des touches pressées par l’utilisateur. L’ application consiste en une « baballe » qui se déplace 
dans la fenêtre et dont on contrôle les propriétés à la souris (cf. figure 20.6). Vous pouvez télécharger le script ici !!. 


"""Super appli baballe !!! 


Usage: python tk_baballe.py 

- clic gauche: faire grossir la baballe 

- clic droit: faire rétrécir la baballe 

- clic central: relance la baballe (depuis le point du clic) 
dans une direction aléatoire 

- touche Esc: quitte l'appli baballe 


nun 


import tkinter as tk 
import random as rd 


class AppliBaballe(tk.Tk): 

def __init__(self): 
"""Constructeur de l'application.""" 
tk.Tk.__init__(self) 
# Coord baballe. 
self.x, self.y = 200, 200 
# Rayon baballe. 
self.size = 50 
# Pas de deplacement. 
self.dx, self.dy = 20, 20 
# Création et packing du canvas. 
self.canv = tk.Canvas(self, bg='light gray', height=400, width=400) 
self.canv.pack() 
# Création de la baballe. 


11. https://python.sdv.univ-paris-diderot.fr/data-files/tk_baballe.py 
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self.baballe = self.canv.create_oval(self.x, self.y, 
self .x+self.size, 
self .y+self.size, 
width=2, fill="blue") 
# Binding des actions. 


self .canv.bind("<Button-1>", self. incr) 
self .canv.bind("<Button-2>", self.boom) 
self.canv.bind("<Button-3>", self.decr) 


self .bind("<Escape>", self.stop) 
# Lancer la baballe. 


self .move() 


def move(self): 
"""Déplace la baballe (appelée itérativement avec la méthode after).""" 
# Incrémente coord baballe. 
self.x += self .dx 
self.y += self .dy 
# Vérifier que la baballe ne sort pas du canvas (choc élastique). 
if self.x < 10: 
self.dx = abs(self.dx) 
if self.x > 400-self.size-10: 
self.dx = -abs(self.dx) 
if self.y < 10: 
self.dy = abs(self.dy) 
if self.y > 400-self.size -10: 
self.dy = -abs(self.dy) 
# Mise à jour des coord. 
self.canv.coords(self.baballe, self.x, self.y, self.x+self.size, 
self .y+self.size) 
# Rappel de move toutes les 50ms. 
self .after(50, self.move) 


def boom(self, mclick): 
"""Relance la baballe dans une direction aléatoire au point du clic.""" 


self.x = mclick.x 
self.y = mclick.y 
self.canv.create_text(self.x, self.y, text="Boom !", fill="red") 


self.dx = rd.choice([-30, -20, -10, 10, 20, 30]) 
self.dy = rd.choice([-30, -20, -10, 10, 20, 30]) 


def incr(self, lclick): 
"""Augmente la taille de la baballe.""" 
self.size += 10 
if self.size > 200: 
self.size = 200 


def decr(self, rclick): 
"""Diminue la taille de la baballe.""" 


self.size -= 10 
if self.size < 10: 
self.size = 10 


def stop(self, esc): 
"""Quitte l'application.""" 


self.quit () 


if name == " ms 


myapp = AppliBaballe() 
myapp.title("Baballe !") 
myapp.mainloop() 


Lignes 19 à 23. Les coordonnées de la baballe, ses pas de déplacement, et sa taille sont créés en tant qu’ attributs de notre 
classe. Ainsi ils seront visibles partout dans la classe. 

Lignes 25 à 31. Le canvas est ensuite créé et placé dans la fenêtre, puis on définit notre fameuse baballe. À noter, les 
coordonnées self .x et self. y de la baballe représentent en fait son côté « nord-ouest » (en haut à gauche, voir le point (xo, 
yo) dans la documentation officielle 13), 

Lignes 33 à 35. Jusqu’à maintenant, nous avons utilisé des événements provenant de clics sur des boutons. Ici, on va 
« intercepter » des événements générés par des clics de souris sur le canvas et les lier à une fonction / méthode (comme 
nous l’avions fait pour les clics sur des boutons avec l’option command=. . .). La méthode pour faire cela est .bind(), voilà 
pourquoi on parle de event binding en anglais. Cette méthode prend en argument le type d'événement à capturer en tant 
que chaîne de caractères avec un format spécial : par exemple "<Button-1>" correspond à un clic gauche de la souris (de 
même "<Button-2>" et "<Button-3>" correspondent aux clics central et droit respectivement). Le deuxième argument de 
la méthode .bind() est une méthode / fonction callback à appeler lors de la survenue de l’événement (comme pour les clics 


12. http://infohost.nmt.edu/tcc/help/pubs/tkinter/web/create_oval.html 
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de bouton, vous vous souvenez ? On l’appelle donc sans parenthèses ni arguments). On notera que tous ces événements sont 
liés à des clics sur le canvas, mais il est possible de capturer des événements de souris sur d’autres types de widgets. 

Ligne 36. De même, on peut « intercepter » un événement lié à l’appui sur une touche, ici la touche Esc. 

Ligne 38. La méthode .move() est appelée, ainsi l’animation démarrera dès l’exécution du constructeur, donc peu après 
l’instanciation de notre application (Ligne 86). 

Lignes 40 à 58. On définit une méthode .move() qui va gérer le déplacement de la baballe avec des chocs élastiques sur 
les parois (et faire en sorte qu’elle ne sorte pas du canvas). 

Lignes 55 et 56. On utilise la méthode . coords() de la classe Canvas, qui « met à jour » les coordonnées de n'importe 
quel objet dessiné dans le canvas (c’est-à-dire que cela déplace l’objet). 

Ligne 58. Ici, on utilise une autre méthode spécifique des objets Tkinter. La méthode . after () rappelle une autre méthode 
ou fonction (second argument) après un certain laps de temps (ici 50 ms, passé en premier argument). Ainsi la méthode 
-move() se rappelle elle-même, un peu comme une fonction récursive. Toutefois, ce n’est pas une vraie fonction récursive 
comme celle vue dans le chapitre 12 (exemple du calcul de factorielle), car Python ne conserve pas l’état de la fonction lors 
de l’appel de .after(). C’est comme si on avait un return, tout l’espace mémoire alloué à la méthode .move () est détruit 
lorsque Python rencontre la méthode .after(). On obtiendrait un résultat similaire avec la boucle suivante : 


import time 


while True: 
move () 
time.sleep(0.05) # attendre 50 ms 


Le temps de 50 ms donne 20 images (ou clichés) par seconde. Si vous diminuez ce temps, vous aurez plus d’images par 
secondes et donc un « film » plus fluide. 

Ligne 60 à 66. On définit la méthode .boom() de notre classe qui on se souvient est appelée lors d’un événement clic cen- 
tral sur le canvas. Vous noterez qu'outre le self, cette fonction prend un autre argument que nous avons nommé ici mclick. 
Il s’agit d’un objet spécial géré par Tkinter qui va nous donner des informations sur l’événement généré par l'utilisateur. Dans 
les lignes 62 et 63, cet objet mclick récupère les coordonnées où le clic a eu lieu grâce aux attributs mclick.xetmclick.y. 
Ces coordonnées sont réaffectées à la baballe pour la faire repartir de l’endroit du clic. Nous créons ensuite un petit texte dans 
le canevas et affectons des valeurs aléatoires aux variables de déplacement pour faire repartir la baballe dans une direction 
aléatoire. 

Lignes 68 à 78. On a ici deux méthodes .incr() et .decr() appelées lors d’un clic gauche ou droit. Deux choses sont à 
noter : i) l’attribut self .size est modifié dans les deux fonctions, mais le changement de diamètre de la boule ne sera effectif 
dans le canvas que lors de la prochaine exécution de l’instruction self .canv.coords() (dans la méthode .move()); ii) de 
même que pour la méthode .boom(), ces deux méthodes prennent un argument après le self (1click ou rclick) récupérant 
ainsi des informations sur l’événement de l’utilisateur. Même si on ne s’en sert pas, cet argument après le self est obligatoire 
car il est imposé par la méthode .bind(). 

Lignes 80 à 82. Cette méthode quitte l’application lorsque l’utilisateur fait un clic sur la touche Esc. 

Il existe de nombreux autres événements que l’on peut capturer et lier à des méthodes / fonctions callback. Vous trouverez 


une liste complète ici !. 


20.7 Pour aller plus loin 


20.7.1 D’autres widgets 


Jusqu’a maintenant nous avons vu les widgets Button, Canvas, Label, mais il en existe bien d’autres. En voici la liste avec 
une bréve explication pour chacun : 

— Checkbutton : affiche des cases à cocher. 

— Entry : demande a l'utilisateur de saisir une valeur / une phrase. 

— Listbox : affiche une liste d’ options à choisir (comme dans la figure 20.1). 

— Radiobutton : implémente des « boutons radio ». 

— Menubutton et Menu : affiche des menus déroulants. 

— Message : affiche un message sur plusieurs lignes (extensions du widget Label). 

— Scale : affiche une règle graduée pour que l’utilisateur choisisse parmi une échelle de valeurs. 

— Scrollbar : affiche des ascenseurs (horizontaux et verticaux). 


13. http://effbot.org/tkinterbook/tkinter-events-and-bindings.htm 
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X X Baballe ! = oO x 


Boom ! Boom 
Boom ! Boom ! 


Boom ! Boom ! 


FIGURE 20.6 — Exemple de canvas animé à deux instants de l’exécution (panneau de gauche : au moment où on effectue un 
clic central ; panneau de droite : après avoir effectué plusieurs clics gauches). 


— Text : crée une zone de texte dans lequel l’utilisateur peut saisir un texte sur plusieurs lignes (comme dans la figure 
20.1). 

— Spinbox : sélectionne une valeur parmi une liste de valeurs. 

— tkMessageBox : affiche une boîte avec un message. 


Il existe par ailleurs des widgets qui peuvent contenir d’autres widgets et qui organisent le placement de ces derniers : 


— Frame : widget container pouvant contenir d’autres widgets classiques, particulièrement utile lorsqu’on réalise une 
GUI complexe avec de nombreuses zones. 

— LabelFrame : comme Frame mais affiche aussi un label sur le bord. 

— Toplevel : pour créer des fenêtres indépendantes. 

— PanedWindow : container pour d’autres widgets, mais ici l’utilisateur peut réajuster les zones affectées à chaque widget 
fils. 


Vous trouverez la documentation exhaustive pour tous ces widgets (ainsi que ceux que nous avons décrits dans les rubriques 
précédentes) sur le site de l’Institut des mines et de technologie du Nouveau Mexique !* (MNT). Par ailleurs, la page Universal 
widget methods '° vous donnera une vue d’ensemble des différentes méthodes associées à chaque widget. 


Il existe également une extension de Tkinter nommée ttk, réimplémentant la plupart des widgets de base de Tkinter et qui 
en propose de nouveaux (Combobox, Notebook, Progressbar, Separator, Sizegrip et Treeview). Typiquement, si vous utilisez 
ttk, nous vous conseillons d’utiliser les widgets ttk en priorité, et pour ceux qui n’ existent pas dans ttk, ceux de Tkinter (comme 
Canvas qui n’existe que dans Tkinter). Vous pouvez importer le sous-module ttk de cette manière : import tkinter.ttk 
as ttk. 


Vous pourrez alors utiliser les classes de widget de ttk (par exemple ttk.Button, etc.). Si vous souhaitez importer ttk et 
Tkinter, il suffit d’ utiliser ces deux lignes : 


import tkinter as tk 
import tkinter.ttk as ttk 


Ainsi vous pourrez utiliser des widgets de Tkinter et de ttk en méme temps. 


Pour plus d'informations, vous pouvez consulter la documentation officielle de Python '°, ainsi que la documentation très 
complète du site du MNT ””. 


14. http://infohost.nmt.edu/tcc/help/pubs/tkinter/web/index.html 

15. https://infohost.nmt.edu/tcc/help/pubs/tkinter/web/universal.html 
16. https://docs.python. org/3/library/tkinter.ttk.html 

17. http: //infohost.nmt.edu/tcc/help/pubs/tkinter/web/ttk.html 
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20.7.2 Autres pistes à approfondir 


Si vous souhaitez aller un peu plus loin en Tkinter, voici quelques notions / remarques qui pourraient vous être utiles. Pour 
les débutants, vous pouvez passer cette rubrique. 


Les variables de contrôle 


Lorsque vous souhaitez mettre un jour un widget avec une certaine valeur (par exemple le texte d’un label), vous ne pouvez 
pas utiliser une variable Python ordinaire, il faudra utiliser une variable Tkinter dite de contrôle. Par exemple, si on souhaitait 
afficher les coordonnées de notre baballe (cf. rubrique précédente) dans un label, et que cet affichage se mette à jour au fur 
et à mesure des mouvements de la baballe, il faudrait utiliser des variables de contrôle. On peut créer de telles variables avec 
les classes tk.StringVar pour les chaînes de caractères, tk. DoubleVar pour les floats, et tk. IntVar pour les entiers. Une 
fois créée, par exemple avec l'instruction var = tk.StringVar(), on peut modifier la valeur d’une variable de contrôle 
avec la méthode var . set (nouvelle_valeur) : ceci mettra à jour tous les widgets utilisant cette variable var. Il existe aussi 
la méthode var. get () qui récupère la valeur actuelle contenue dans var. Enfin, il faudra lors de la création du label utiliser 
l’option textvariable= avec votre variable de contrôle (par exemple tk.Label(..., textvariable=var, ...)) pour 
que cela soit fonctionnel. 

A nouveau, vous trouverez une documentation précise sur le site du MNT 18, 


Autres méthodes de placement des widgets dans la fenêtre Tk 


Dans les exemples montrés dans ce chapitre, nous avons systématiquement utiliser la méthode .pack() pour placer les 
widgets. Cette méthode très simple et directe « empaquette » les widgets les uns contre les autres et redimensionne la fenêtre 
automatiquement. Avec l’option side= et les variables tk.BOTTOM, tk.LEFT, tk.TOP et tk.RIGHT on place facilement les 
widgets les uns par rapport aux autres. Toutefois, la méthode .pack() peut parfois présenter des limites, il existe alors deux 
autres alternatives. 

La méthode .grid() permet, grâce à l’utilisation d’une grille, un placement mieux contrôlé des différents widgets. La 
méthode .place() place enfin les widgets en utilisant les coordonnées de la fenêtre principale. Nous ne développerons pas 
plus ces méthodes, mais voici de la documentation supplémentaire en accès libre : 

— ¿packO ©: 

— er) ”,?!; 

— .place() ”. 


Hériter de la classe Frame pour vos applications ? 


Comme illustré dans nos exemples, nous vous recommandons pour vos classes applications Tkinter d hériter de la classe 
mère tk. Tk et d’utiliser le constructeur de la classe mère tk.Tk.__init__(). Toutefois, il se peut qu’en consultant d’autres 
ressources certains auteurs utilisent la technique d’héritage de la classe mère tk.Frame : 


import tkinter as tk 


class Application(tk.Frame): 


def __init__(self, racine=None): 
tk.Frame.__init__(self, racine) 
self.racine = racine 


self .create_widgets () 


def create_widgets(self): 
self.label = tk.Label(self.racine, text="J'adore Python !") 
self.bouton = tk.Button(self.racine, text="Quitter", 
fg="green", command=self.quit) 
self.label.pack() 
self.bouton.pack() 


if __name__ == "__main__": 
racine = tk.Tk() 
racine.title("Ma Première App :-)") 


18. https://infohost .nmt.edu/tcc/help/pubs/tkinter/web/control-variables.html 
19. http://effbot.org/tkinterbook/pack.htm 

20. http://effbot.org/tkinterbook/grid.htm 

21. https://infohost.nmt.edu/tcc/help/pubs/tkinter/web/grid.html 

22. http://effbot.org/tkinterbook/place.htm 
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app = Application(racine) 
racine.mainloop() 


Lignes 17 à 21. Commentons d’abord le programme principal : ici on crée la fenêtre principale dans l’instance racine 
puis on instancie notre classe en passant racine en argument. 

Lignes 4 et 5. Ici réside la principale différence par rapport à ce que nous vous avons montré dans ce chapitre : en ligne 
4 on passe l’argument racine à notre constructeur, puis en ligne 5 on passe ce même argument racine lors de l’appel du 
constructeur de la classe tk.Frame (ce qui était inutile lorsqu’ on héritait de la classe Tk). 

Ligne 6. L’argument racine passé à la méthode .__init__() est finalement une variable locale. Comme il s’agit de 
l’instance de notre fenêtre principale à passer à tous nos widgets, il faut qu’elle soit visible dans toute la classe. La variable 
self.racine est ainsi créée afin d’être réutilisée dans d’autres méthodes. 

Vous pourrez vous posez la question : « Pourquoi en ligne 4 l’argument par mot-clé racine=None prend la valeur None 
par défaut ? ». Et bien, c’est parce que notre classe Application peut s’appeler sans passer d’instance de fenêtre Tk. Voici un 
exemple avec les lignes qui changent seulement (tout le reste est identique au code précédent) : 


Lana] 
class Application(tk.Frame): 
def __init__(self, racine=None): 

tk.Frame.__init__ (self) 
self.racine = racine 
Less] 

Lex sd 

if __name__ == "__main__": 


app = Application() 
app.mainloop() 

Dans un tel cas, l’argument racine prend la valeur par défaut None lorsque la méthode .__init__() de notre classe 
est exécutée. L'appel au constructeur de la classe Frame en ligne 4 instancie automatiquement une fenêtre Tk (car cela est 
strictement obligatoire). Dans la suite du programme, cette instance de la fenêtre principale sera self .racine et il n’y aura 
pas de changement par rapport à la version précédente. Cette méthode reste toutefois peu intuitive car cette instance de la 
fenêtre principale self .racine vaut finalement None! 

Hériter de la classe Frame ou de la classe Tk sont deux manières tout à fait valides pour créer des applications Tkinter. Le 
choix de l’une ou de l’autre relève plus de préférences que l’on acquiert en pratiquant, voire de convictions philosophiques 
sur la manière de programmer. Toutefois, nous pensons qu’hériter de la classe tk.Tk est une manière plus générale et plus 
compacte : tout ce qui concerne le fenêtrage Tkinter se situera dans votre classe Application, et le programme principal n’aura 
qu’à instancier l’application et à lancer le gestionnaire d'événements (les choses seront ainsi mieux « partitionnées »). C’est 
donc la méthode que nous vous recommandons. 


Passage d’arguments avec xargs et **kwargs 


Si vous allez chercher de la documentation supplémentaire sur Tkinter, il se peut que vous tombiez sur ce style de syntaxe 
lorsque vous créez votre classe contenant l’application graphique : 


class MonApplication(tk.Tk): 
def __init__(self, *args, **kwargs): 
tk.Tk.__init__(self, *args, **kwargs) 
# ici débute la construction de votre appli 


Loc 

# programme principal 

if __name__ == "__main__": 
Pis 
app = MonApplication() 
| 


Les arguments *args et **kwargs récupérent facilement tous les arguments « positionnels » et « par mot-clé ». Pour plus 
de détails sur comment *args et **kwargs fonctionnent, reportez-vous au chapitre 21 Remarques complémentaires. 

Dans l’exemple ci-dessus, *args et **kwargs sont inutiles car lors de l’instanciation de notre application, on ne passe 
aucun argument : app = MonApplication(). Toutefois, on pourrait être intéressé à récupérer des arguments passés au 
constructeur, par exemple : 


app = MonApplication(argi, arg2, optioni=vali, option2=val2) 


Ainsi certains auteurs laissent toujours ces *args et **kwargs au cas où on en ait besoin dans le futur. Cela est bien utile 
lorsqu’ on distribue notre classe à la communauté et que l’on souhaite que les futurs utilisateurs puissent passer des arguments 
Tkinter au constructeur de notre classe. 
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Toutefois, même si cela « ne coûte rien », nous vous recommandons de ne pas mettre ces xargs et **kwargs si vous n’en 
avez pas besoin, comme nous vous l’avons montré dans les exemples de ce chapitre. Rappelons nous de la PEP 20 (cf. chapitre 
15 Bonnes Pratiques en programmation Python), les assertions « Simple is better than complex » ou « Sparse is better than 
dense » nous suggèrent qu'il est inutile d’ajouter des choses dont on ne se sert pas. 


Toujours préciser l’instance de la fenêtre principale 


Tkinter est parfois surprenant. Dans le code suivant, on pourrait penser que celui-ci n’est pas fonctionnel : 


>>> import tkinter as tk 
>>> bouton = tk.Button(text="Quitter") 
>>> bouton.pack() 


Pour autant, cela fonctionne et on voit un bouton apparaître ! En fait, Tkinter va automatiquement instancier la fenêtre 
principale, si bien qu’il n’est pas obligatoire de passer cette instance en argument d’un widget. À ce moment, on peut se de- 
mander où est passé cette instance. Heureusement, Tkinter garde toujours une filiation des widgets avec les attributs .master 
et .children: 


>>> racine = bouton.master 
>>> racine 

<tkinter.Tk object .> 

>>> racine.children 


{'!button': <tkinter.Button object .!button>) 
>>> bouton["command"] = racine.destroy 


Ligne 1. On « récupère » l’instance de la fenêtre principale dans la variable racine. 

Les lignes 4 et 5 montrent que le bouton est un « enfant » de cette dernière. 

Enfin, ligne 6, on réassigne la destruction de la fenêtre lorsqu’on clique sur le bouton. 

Ces attributs .master et . children existent pour tous widgets et sont bien pratiques lorsqu’on crée de grosses applica- 
tions graphiques (où on utilise souvent des widgets parents contenant d’autres widgets enfants). Une autre source d’information 
sur les widgets se trouvent dans les méthodes dont le nom commence par winfo. Par exemple, la méthode .winfo_toplevel() 
renvoie la même information que l’attribut .master (une référence vers le widget parent). 


Conseil 
Même si cela est possible, nous vous conseillons de systématiquement préciser l’instance de la fenêtre principale lors de 
la création de vos widgets. 


Passage d’arguments à vos fonctions callback 


Comme vu dans nos exemples ci-dessus, les fonctions callback ne prennent pas d’arguments ce qui peut se révéler parfois 
limitant. Il existe toutefois une astuce qui utilise les fonctions lambda ; nous expliquons brièvement les fonctions lambda dans 
le chapitre 21 Remarques complémentaires. Toutefois, nous ne développons pas leur utilisation avec Tkinter et les fonctions 
callback car cela dépasse le cadre de cet ouvrage. Pour de plus amples explications sur cette question, vous pouvez consulter 
le site pythonprogramming * et le livre de Gérard Swinnen ”*. 


Application Tkinter avec plusieurs pages 


Dans ce chapitre d'introduction, nous vous avons montré des GUI simples avec une seule page. Toutefois, si votre projet 
se complexifie, il se peut que vous ayez besoin de créer plusieurs fenêtre différentes. Le livre de Gérard Swinnen ”* et le site 
pythonprogramming ~° sont des bonnes sources pour commencer et voir concrètement comment faire cela. 


20.7.3 Bibliographie pour aller plus loin 


Voici quelques ressources que vous pouvez utiliser pour continuer votre apprentissage de Tkinter : 


1. En anglais : 


23. https://pythonprogramming.net/passing-functions-parameters-tkinter-using-lambda/ 
24. https://inforef.be/swi/python.htm 

25. https://inforef.be/swi/python.htm 

26. https://pythonprogramming.net/change-show-new-frame-tkinter/ 
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— La Documentation officielle ~’ de Python. 

— Le manuel de référence sur le site du MNT. 

— Le site ?? de Fredrik Lundh est également très complet. 

— Pour avoir un exemple * rapide de code pour chaque widget. 

— Le livre?! de David Love Learn Tkinter By Example qui montre des exemples concrets d’ applications Tkinter de plus 
en plus complexes (pdf en libre téléchargement). 

— Le site *? très bien fait de Harisson (avec vidéos !) vous guidera dans la construction d’une GUI complète et complexe 
avec de nombreuses fonctions avancées (comme par exemple mettre des graphes matplotlib qui se mettent à jour dans 
la GUI”). 


2. En francais : 


— Le site ** bien complet d'Étienne Florent. 
— Le livre * de Gérard Swinnen qui montre de nombreux exemples d’ applications tkinter (pdf en libre téléchargement). 


20.8 Exercices 


Conseil : dans tous les exercices qui suivent nous vous recommandons de concevoir une classe pour chaque exercice. 


20.8.1 Application de base 


Concevez une application qui affiche l’heure dans un label (par exemple 09:10:55) et qui possède un boutton quitter. 
L'heure affichée sera celle au moment du lancement de l’ application. Pour « attraper » l’heure, vous pourrez utiliser la fonction 
strftime() du module time. 


20.8.2 Horloge 


Sur la base de l’application précédente, faites une application qui affiche l’heure dans un /abel en se mettant à jour sur 
l’heure de l’ordinateur une fois par seconde. Vous concevrez une méthode .mise_a_jour_heure() qui met à jour l’heure 
dans le label et qui se rappelle elle-même toutes les secondes (n'oubliez pas la méthode .after(), cf. rubrique Un canvas 
animé dans une classe ci-dessus). Pour cette mise à jour, vous pourrez utiliser la méthode .configure(), par exemple : 
self.label.configure(text=heure) où heure est une chaîne de caractères représentant l’heure actuelle. 


20.8.3 Compte à rebours 


Créer une application affichant un compte à rebours dans un label. L'utilisateur choisira entre 1 et 240 minutes en passant 
un argument au lancement du script, par exemple : python tk_compte_a_rebours.py 34 signifiera un compte à rebours 
de 34’ (le programme vérifiera qu’il s’agit d’un entier entre 1 et 240 inclus). Il y aura un bouton « Lancer » pour démarrer 
le compte à rebours et un boutton « Quitter » au cas où on veuille quitter avant la fin. À la fin du rebours, le programme 
affichera 10 fois la phrase « C’est fini!!! » dans le shell et quittera automatiquement le script. Une image du résultat attendu 
est montrée dans la figure 20.7. 


20.8.4 Triangle de Sierpinski 


Le triangle de Sierpinski * est une fractale classique. On se propose ici de la dessiner avec un algorithme tiré du jeu du 
chaos *°. Celui-ci se décompose en pseudo-code de la façon suivante : 


27. https://wiki.python.org/moin/TkInter 

28. https://infohost.nmt.edu/tcc/help/pubs/tkinter/web/index.html 

29. http: //effbot.org/tkinterbook/ 

30. https: //www.tutorialspoint.com/python/python_gui_programming.htm 

31. https: //github.com/Dvlv/Tkinter-By-Example 

32. https: //pythonprogramming.net/tkinter-depth-tutorial-making-actual-program/ 
33. http://tkinter.fdex.eu/index.html 

34. https: //inforef .be/swi/python.htm 

35. https: //fr.wikipedia.org/wiki/Triangle_de_Sierpi/C5/84ski 

36. https: //fr.wikipedia.org/wiki/Jeu_du_chaos 


Cours de Python / Université de Paris / UFR Sciences du Vivant 


20.8. Exercices Chapitre 20. Fenêtres graphiques et Tkinter 


Compte à rebours 


00:01:49 


Quitter | 


Lancer 


FIGURE 20.7 — Compte à rebours. 


X Sierpinski x 


Cliquez sur Launch pour afficher 10000 points supplémentaires ! 


Quitter 


Launch! 


Y. 
ha 
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BÉ 


FIGURE 20.8 — Triangle de Sierpinski. 


définir les 3 sommets d'un triangle isocèle ou équilatéral 
point <- coordonnées (x, y) du centre du trianle 
dessiner (point) # un pixel de large 
pour i de 0 à 25000: 
sommet_tmp <- choisir un sommet du triangle au hasard 
point <- calculer(coordonnées(x, y) du centre entre point et sommet_tmp) 


dessiner (point) 


Le rendu final attendu est montré dans la figure 20.8. On utilisera un canevas de 400x400 pixels. Il y a aura un bouton « 
Quitter » et un bouton « Launch! » qui calculera et affichera 10000 points supplémentaires dans le triangle de Sierpinski. 


20.8.5 Polygone de Sierpinski (exercice +++) 


Améliorer l’ application précédente en proposant une liste de choix supplémentaire demandant à l'utilisateur de choisir le 
nombre de sommets (de 3 a 10). Le programme calculera automatiquement la position des sommets. Pour prendre en main 
le widget Listbox, voici un code minimal qui pourra vous aider. Celui-ci contient une Listbox et permet d’afficher dans le 
terminal I’ élément sélectionné. Nous vous conseillons de bien étudier le code ci-dessous et d’avoir résolu l’exercice précédent 
avant de vous lancer ! 


import tkinter as tk 
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class MaListBox(tk.Tk): 
def __init__(self): 
# Instanciation fenêtre Tk. 
tk.Tk.__init__(self) 
self.listbox = tk.Listbox(self, height=10, width=4) 
self.listbox.pack() 
# Ajout des items à la listbox (entiers). 
for i in range(1, 10+1): 
# Utilisation de ma méthode .insert(index, element) 
# Ajout de l'entier i (tk.END signifie en dernier). 


self.listbox.insert(tk.END, i) 
# Selection du premier élément de listbox. 


self.listbox.select_set (0) 
# Liaison d'une méthode quand clic sur listbox. 
self .listbox.bind("<<ListboxSelect >>", self.clic_listbox) 


def clic_listbox(self, event): 
# Récupération du widget à partir de l'objet event. 
widget = event.widget 
# Récupération du choix sélectionné dans la listbox (tuple). 
tt Par exemple renvoie ~(5,)~ si on a cliqué sur ‘5° 
selection = widget.curselection() 
# Récupération du nombre sélectionné (déjà un entier). 
choix _select = widget.get(selection[0]) 
# Affichage. 
print(f"Le choix sélectionné est {choix _select}, " 

f"son type est {type(choix_select)}") 


if __name__ == "__main__": 


app = MaListBox() 
app.title("MaListBox") 
app.mainloop() 


20.8.6 Projet simulation d’un pendule 


Vous souhaitez aller plus loin après ces exercices de « mise en jambe »? Nous vous conseillons d’aller directement au 
chapitre 22 Mini projets. Nous vous proposons de réaliser une application Tkinter qui simule le mouvement d’un pendule. 
En réalisant une application complète de ce genre, un peu plus conséquente, vous serez capable de construire vos propres 
applications. 
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Remarques complémentaires 


21.1 Différences Python 2 et Python 3 


Python 3 est la version de Python qu'il faut utiliser. 
Néanmoins, Python 2 a été employé pendant de nombreuses années par la communauté scientifique et vous serez certai- 
nement confrontés à un programme écrit en Python 2. Voici quelques éléments pour vous en sortir : 


21.1.1 Le mot-clé print / la fonction print (O 


En Python 2 print est un mot-clé du langage (en anglais statement) au même titre que for, if, def, etc. Il s’utilise ainsi 


sans parenthèse. Par exemple : 
>>> print 12 
12 
>>> print "girafe" 
girafe 


Par contre en Python 3, print () est une fonction. Ainsi, si vous n’utilisez pas de parenthèse, Python vous renverra une 
erreur : 
>>> print 12 
File "<stdin>", line 1 


print 12 


SyntaxError: Missing parentheses in call to 'print' 


21.1.2 Division d’entiers 
En Python 3, la division de deux entiers, se fait naturellement, c’est-à-dire que l’opérateur / renvoie systématiquement un 
float. Par exemple : 


>>> 3 / 4 
0.75 


Il est également possible de réaliser une division entière avec l’opérateur / / : 


>>> 3 // 4 
0 


La division entière renvoie finalement la partie entière du nombre 0.75, c’est-à-dire 0. 
Attention! En Python 2, la division de deux entiers avec l’opérateur / correspond à la division entière, c’est-à-dire le 
résultat arrondi à l’entier inférieur. Par exemple : 


>>> 3 / 5 
0 
>>> 4/3 
1 


Faites très attention a cet aspect si vous programmez encore en Python 2, c’est une source d’ erreur récurrente. 
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21.1.3 La fonction range () 


En Python 3, la fonction range () est un générateur, c’est-à-dire que cette fonction va itérer sur le nombre entier donner 
en argument. On ne peut pas l’utiliser seule : 


>>> range (3) 
range(0, 3) 
Lorsqu'on utilise range (3) dans une boucle, cela va produire successivement les nombres 0, puis 1 puis 2. Par exemple : 


>>> for i in range (3): 
print (i) 


0 
1 
2 


En Python 2, la fonction range () renvoie une liste. Par exemple : 


>>> range (3) 
[o, 1, 2] 

>>> range(2, 6) 
[2, 3, 4, 5] 


La création de liste avec range () était pratique mais très peu efficace en mémoire lorsque l’argument donné à range () 
était un grand nombre. 

D'ailleurs la fonction xrange () est disponible en Python 2 pour faire la même chose que la fonction range() en Python 
3. Attention, ne vous mélangez pas les pinceaux ! 


>>> range (3) 
[o, 1, 2] 
>>> xrange (3) 
xrange (3) 


Remarque 
Pour générer une liste d’entiers avec la fonction range () en Python 3, vous avez vu dans le chapitre 4 Listes qu'il suffit 
de l’associer avec la fonction list (). Par exemple : 


>>> list (range (10)) 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


21.1.4 Encodage et utf-8 


En Python 3, vous pouvez utiliser des caractères accentués dans les commentaires ou dans les chaîne de caractères. 
Ce n’est pas le cas en Python 2. Si un caractère accentué est présent dans votre code, cela occasionnera une erreur de ce 
type lors de l’exécution de votre script : 


SyntaxError: Non-ASCII character '\xc2' in file xxx on line yyy, but no encoding 
declared; see http://python.org/dev/peps/pep-0263/ for details 
Pour éviter ce genre de désagrément, ajoutez la ligne suivante en tout début de votre script : 
# coding: utf-8 
Si vous utilisez un shebang (voir rubrique précédente), il faudra mettre la ligne # coding: utf-8 sur la deuxiéme ligne 
(la position est importante !) de votre script : 


#! /usr/bin/env python 
# coding: utf-8 


Remarque 
Lencodage utf-8 peut aussi être déclaré de cette manière : 
# -*- coding: utf-8 -*- 


mais c’est un peu plus long à écrire. 


1. http://www.python.org/dev/peps/pep-0263/ 
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21.2 Gestion des exceptions 


Les langages de programmation comme Python contiennent un système de gestion des exceptions ?. Qu'est-ce qu’une 
exception ? Sur la page anglaise de Wikipedia *, une exception est définie comme une anomalie de l’exécution d’un programme 
requérant une action spéciale, en général l’arrêt de l’exécution. Le plus souvent, une exception correspond à une erreur que 
Python rencontre lorsqu'il tente d'exécuter les lignes de code qu’on lui soumet. Par exemple, un problème de syntaxe, une 
variable ou objet qui prend une valeur aberrante (par exemple diviser par 0, parcourir une liste au delà du nombre d’éléments, 
etc.). 

Le système de gestion des exceptions évite que votre programme « plante » en prévoyant vous-même les sources d’ erreurs 
éventuelles. 

Voici un exemple dans lequel on demande à l’utilisateur d’entrer un nombre entier, puis on affiche ce nombre. 


>>> nb = int(input ("Entrez un nombre entier : ")) 
Entrez un nombre entier : 23 

>>> print (nb) 

23 


La fonction input () demande à l’utilisateur de saisir une chaîne de caractères. Cette chaîne de caractères est ensuite 
transformée en nombre entier avec la fonction int O. 
Si l'utilisateur ne rentre pas un nombre, voici ce qui se passe : 


>>> nb = int(input ("Entrez un nombre entier : ")) 
Entrez un nombre entier : ATCG 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 
ValueError: invalid literal for int() with base 10: 'ATCG' 


L'erreur provient de la fonction int () qui n’a pas pu convertir la chaîne de caractères "ATCG" en nombre entier, ce qui 
est parfaitement normal. En termes plus techniques, on dira que « Python a levé une exception de type ValueError ». Eh oui 
il y a de nombreux types d’exceptions différents (voir plus bas)! Le nom de l’exception apparaît toujours comme le premier 
mot de la dernière ligne du message d’erreur. Si nous lancions ces lignes de code sous forme de script (du style python 
script.py), cet exemple conduirait à l’arrêt de l’exécution du programme. 

Le jeu d'instructions try / except permet de tester l’exécution d’une commande et d'intervenir en cas de levée d’excep- 
tion. 


>>> try: 
nb = int(input ("Entrez un nombre entier : ")) 
except: 
print ("Vous n'avez pas entré un nombre entier !") 
Entrez un nombre entier : ATCG 


Vous n'avez pas entré un nombre entier ! 


Dans cette exemple, l’exception levée par la fonction int () (qui ne peut pas convertir "ATCG" en nombre entier) est 
interceptée et déclenche l’affichage du message d’avertissement. 
On peut ainsi redemander sans cesse un nombre entier à l’utilisateur, jusqu’à ce que celui-ci en rentre bien un. 


>>> while True: 


try: 
nb = int(input ("Entrez un nombre entier : ")) 
print ("Le nombre est", nb) 
break 

except: 
print ("Vous n'avez pas entré un nombre entier !") 
print ("Essayez encore") 

Entrez un nombre entier : ATCG 


Vous n'avez pas entré un nombre entier ! 
Essayez encore 

Entrez un nombre entier : toto 

Vous n'avez pas entré un nombre entier ! 
Essayez encore 

Entrez un nombre entier : 3.2 

Vous n'avez pas entré un nombre entier ! 
Essayez encore 

Entrez un nombre entier : 55 

Le nombre est 55 


Notez que dans cet exemple, l'instruction while True est une boucle infinie car la condition True est toujours vérifiée. 
L'arrêt de cette boucle est alors forcé par la commande break lorsque l’utilisateur a effectivement entré un nombre entier. 


2. https://fr.wikipedia. org/wiki/Syst/C3/,A8me_de_gestion_d/27exceptions 
3. https://en.wikipedia.org/wiki/Exception_handling 
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La gestion des exceptions est très utile dès lors que des données extérieures entrent dans un programme Python, que ce soit 
directement par l’utilisateur (avec la fonction input ()) ou par des fichiers. Cela est fondamental si vous distribuez votre code 
à la communauté : si les utilisateurs ne connaissent pas Python, un message comme Vous n'avez pas entré un nombre 
entier ! reste plus clair que ValueError: invalid literal for int() with base 10: 'ATCG'. 

Vous pouvez par exemple vérifier qu’un fichier a bien été ouvert. 


>>> nom = "toto.pdb" 
>>> try: 
with open(nom, "r") as fichier: 
for ligne in fichier: 
print (ligne) 
except: 
print ("Impossible d'ouvrir le fichier", nom) 


Si une erreur est déclenchée, c’est sans doute que le fichier n’ existe pas à l’ emplacement indiqué sur le disque ou que vous 
n’avez pas les droits pour le lire. 
Il est également possible de spécifier le type d’ erreur à gérer. Le premier exemple que nous avons étudié peut s’écrire : 


>>> try: 
nb = int(input("Entrez un nombre entier : ")) 
except ValueError: 
print ("Vous n'avez pas entré un nombre entier !") 
Entrez un nombre entier : ATCG 


Vous n'avez pas entré un nombre entier ! 


Ici, on intercepte une exception de type ValueError, ce qui correspond bien à un problème de conversion avec int (). 
Attention, si vous précisez le type d’exception comme ValueError, le except ValueError n’empéchera pas la levée 
d’une autre exception. 
>>> try: 
nb = int (variable) 


except ValueError: 
print("Vous n'avez pas entré un nombre entier !") 


Traceback (most recent call last): 
File "<stdin>", line 2, in <module> 
NameError: name 'variable' is not defined 


Ici l’ exception levée est de type NameError car variable n’existe pas. Alors que si vous mettez except tout court, cela 
intercepte n’importe quelle exception. 


>>> try: 
nb = int (variable) 
except: 
print("Vous n'avez pas entré un nombre entier !") 


Vous n'avez pas entré un nombre entier ! 
>>> 


Vous voyez qu’ici cela pose un nouveau problème : le message d’ erreur ne correspond pas à l’exception levée ! 


Conseil 

— Nous vous conseillons vivement de toujours préciser le type d’exception dans vos except. Cela évite d’intercepter une 

exception que vous n'aviez pas prévue. Il est possible d’intercepter plusieurs types d’ exceptions en passant un tuple à 
except, par exemple : except (Exceptioni, Exception2). 

— Pa ailleurs, ne mettez pas trop de lignes dans le bloc du try. Dans un tel cas, il peut être très pénible de trouver la 
ligne qui a conduit a l’exécution du except. Pire encore, il se peut que des lignes que vous aviez prévues ne soient 
pas exécutées ! Donc gardez des choses simples dans un premier temps, comme par exemple tester les conversions de 
type ou vérifier qu’un fichier existe bien et que vous pouvez l’ ouvrir. 


Il existe de nombreux types d’exception comme RuntimeError, TypeError, NameError, I0Error, etc. Vous pouvez 
aller voir la liste compléte* sur le site de Python. Nous avions déjà croisé des noms d’ exception au chapitre 19 (Avoir la classe 
avec les objets) en regardant ce que contient le module builtins. 

>>> import builtins 


>>> dir(builtins) 
['ArithmeticError', 'AssertionError', 'AttributeError', 'BaseException', 


4. https://docs.python.org/fr/3.7/library/exceptions.html#exceptions.TypeError 
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[ 


'UserWarning', 'ValueError', 'Warning', 'ZeroDivisionError 


[eed 


1 


Leur présence dans le module builtins signifie qu’ elles font partie du langage lui même, au même titre que les fonctions 
de base comme range (), list (O, etc. 

Avez-vous aussi remarqué que leur nom commence toujours par une majuscule et qu’il peut en contenir plusieurs à la 
façon CamelCase? Si vous avez bien lu le chapitre 15 Bonnes Pratiques, avez-vous deviné pourquoi? Et bien, c’est parce 
que les exceptions sont des classes. C’est très intéressant car il est ainsi possible d’utiliser l’héritage pour créer ses propres 
exceptions à partir d’exceptions pré-existantes. Nous ne développerons pas cet aspect, mais en guise d’ illustration, regardez 
ce que renvoit un help() de l’exception OverflowError. 


>>> help (OverflowError) 


Loss] 
class OverflowError(ArithmeticError) 
| Result too large to be represented. 


| 

| Method resolution order: 
| OverflowError 

| ArithmeticError 

| Exception 

| BaseException 

| object 


` 


L’exception OverflowError hérite de ArithmeticError, c’est-à-dire qu'OverflowError a été conçue à partir de 
ArithmeticError et en hérite de tous ses attributs. 

Un autre aspect très important que nous avons croisé au chapitre 19 est la possibilité de lever vous-même une exception 
avec le mot-clé raise. Nous avions vu le code suivant : 


if valeur < 0: 
raise ValueError("Z'avez déja vu une masse négative ? C'est nawak") 


La ligne 2 lève une exception ValueError lorsque la variable valeur est négative. L’instruction raise est bien pratique 
lorsque vous souhaitez stopper l’exécution d’un programme si une variable ne se trouve pas dans le bon intervalle ou ne 
contient pas la bonne valeur. Vous avez sans doute compris maintenant pourquoi on parlait de « levée » d’exception... Pour 
les non anglophones, allez voir ce que signifie raise en anglais ;-)! 

Enfin, on peut aussi étre trés précis dans le message d’ erreur. Observez la fonction download_page() qui, avec le module 
urllib, télécharge un fichier sur internet. 


import urllib.request 


def download_page (address): 
error = "" 
page = 
try: 


data urllib.request.urlopen(address) 


page = data.read() 
except IOError as e: 


if hasattr(e, 'reason'): 

error = "Cannot reach web server: " + str(e.reason) 
if hasattr(e, 'code'): 

error = f"Server failed {e.code:d}" 


return page, error 
data, error = download_page("https://files.rcsb.org/download/1BTA. pdb") 


if error: 
print(f"Erreur rencontrée : ferror)") 
else: 
with open("proteine.pdb", "w") as prot: 
prot.write(data.decode("utf-8")) 
print("Protéine enregistrée") 


La variable e est une instance de l’exception I0Error. Certains de ses attributs sont testés avec la fonction hasattr () 
pour ainsi affiner le message renvoyé (ici contenu dans la variable error). 

Si tout se passe bien, la page est téléchargée est stockée dans la variable data, puis ensuite enregistrée sur le disque dur. 

Pour aller plus loin sur les exceptions, vous pouvez lire l’excellente page > du blog impertinent et politiquement incorrect 
de Sam et Max. 


5. https: //sametmax.com/gestion-des-erreurs-en-python/ 
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21.3 Shebang et /usr/bin/env python3 


Lorsque l’on programme sur un système Unix (Mac OS X ou Linux par exemple), on peut exécuter directement un script 
Python, sans appeler explicitement la commande python. 
Pour cela, deux opérations sont nécessaires : 


1. Préciser la localisation de l’interpréteur Python en indiquant dans la première ligne du script : 


#! /usr/bin/env python 


Par exemple, si le script fesf.py contenait : 


print ("Hello World !") 


il va alors contenir : 


#!/usr/bin/env python 


print ("Hello World !") 


2. Rendre le script Python exécutable en lançant I’ instruction : 


$ chmod +x test.py 


Remarque 
La ligne #! /usr/bin/env python n’est pas considérée comme un commentaire par Python, ni comme une instruction 
Python d’ailleurs . Cette ligne a une signification particulière pour le système d’exploitation Unix. 


Pour exécuter le script, il suffit alors de taper son nom précédé des deux caractères ./ (afin de préciser au shell où se trouve 
le script) : 


$ ./test.py 
Hello World ! 


Définition 
Le shebang correspond aux caractères ++! qui se trouvent au début de la première ligne du script test. 
Le shebang est suivi du chemin complet du programme qui interprète le script ou du programme qui sait où se trouve 
l’interpréteur Python. Dans l’exemple précédent, c’est le programme /usr/bin/env qui indique où se trouve l’interpréteur 
Python. 


21.4 Passage d’arguments avec *args et **kwargs 


Avant de lire cette rubrique, nous vous conseillons de bien relire et maitriser la rubrique Arguments positionnels et argu- 
ments par mot-clé du chapitre 9 Fonctions. 

Dans le chapitre 9, nous avons vu qu'il était nécessaire de passer à une fonction tous les arguments positionnels définis 
dans celle-ci. Il existe toutefois une astuce permettant de passer un nombre arbitraire d’ arguments positionnels : 


>>> def fct(*args): 
print (args) 
>>> fct() 
O 
>>> fot (1) 
(1,) 
>>> fct(1, 2, 5, "Python") 
(1, 2, 5, 'Python') 
>>> fct(z=1) 


Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: fct() got an unexpected keyword argument 'z' 


6. http://fr.wikipedia.org/wiki/Shebang 
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L'utilisation de la syntaxe xargs permet d'empaqueter tous les arguments positionnels dans un tuple unique args récupéré 
au sein de la fonction. L'avantage est que nous pouvons passer autant d’arguments positionnels que l’on veut. Toutefois, on 
s’aperçoit en ligne 10 que cette syntaxe ne fonctionne pas avec les arguments par mot-clé. 


Il existe un équivalent avec les arguments par mot-clé : 


>>> def fct(**kwargs): 
print (kwargs) 


>>> fct() 

{} 

>>> fct(z=1, gogo="toto") 

{'gogo': 'toto', 'z': 1} 

>>> fct(z=1, gogo="toto", y=-67) 
{'y': -67, 'gogo': 'toto', 'z': 1} 


>>> fct(1, 2) 
Traceback (most recent call last): 
File "<stdin>", line 1, in <module> 


TypeError: fct() takes 0 positional arguments but 2 were given 


La syntaxe **kwargs permet d’empaqueter l’ensemble des arguments par mot-clé, quel que soit leur nombre, dans un 
dictionnaire unique kwargs récupéré dans la fonction. Les clés et valeurs de celui-ci sont les noms des arguments et les 
valeurs passées à la fonction. Toutefois, on s’apercoit en ligne 9 que cette syntaxe ne fonctionne pas avec les arguments 


positionnels. 


Si on attend un mélange d’ arguments positionnels et par mot-clé, on peut utiliser xargs et **kwargs en même temps : 


>>> def fct(*args, **kwargs): 
print (args) 
print (kwargs) 


>>> fct() 


O 

{} 

>>> fct(1, 2) 

(1, 2) 

{} 

>>> fct(z=1, y=2) 
O 


ANS: 2 a AT 

>>> fct(1, 2, 3, z=1, y=2) 
(1, 2, 3) 

Liga Da À 


Deux contraintes sont toutefois à respecter. I] faut toujours : 


— mettre *args avant **kwargs dans la définition de la fonction; 

— passer les arguments positionnels avant ceux par mot-clé lors de l’appel de la fonction. 

Enfin, il est possible de combiner des arguments positionnels avec xargs et **kwargs, par exemple : 

def fct(a, b, *args, **kwargs): 

Dans un tel cas, il faudra obligatoirement passer les deux arguments a et b à la fonction, ensuite on pourra mettre un 


nombre arbitraire d’ arguments positionnels (récupérés dans le tuple args), puis un nombre arbitraire d'arguments par mot-clé 


(récupérés dans le dictionnaire kwargs). 


Conseil 


Les noms *args et **kwargs sont des conventions en Python, ils rappellent les mots arguments et keyword arguments. 
Bien qu’on puisse mettre ce que l’on veut, nous vous conseillons de respecter ces conventions pour faciliter la lecture de votre 


code par d’autres personnes. 


Lutilisation de la syntaxe xargs et **kwargs est très classique dans le module Tkinter présenté dans le chapitre 20. 
Enfin, il est possible d’utiliser ce mécanisme d’empaquetage / désempaquetage (packing / unpacking) dans l’autre sens : 
>>> def fct(a, b, c): 

print (a,b,c) 


>>> t = (-5,6,7) 


>>> 
>>> fct (*t) 
-5 6 7 


Avec la syntaxe *t on désempaquette le tuple à la volée lors de l’appel à la fonction. Cela est aussi possible avec un 


dictionnaire : 
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>>> def fct(x, y, z): 
print(x, y, z) 


>>> dico = {'x': -1, 'y': -2, 'z': -3} 
>>> fct (**dico) 
-1 -2 -3 


Attention toutefois à bien respecter deux choses : 

— laconcordance entre le nom des clés du dictionnaire et le nom des arguments dans la fonction (sinon cela renvoie une 
erreur) ; 

— l’utilisation d’une double étoile pour désempaqueter les valeurs du dictionnaire (si vous utilisez une seule étoile, 
Python désempaquettera les clés !). 


21.5 Un peu de transformée de Fourier avec NumPy 


La transformée de Fourier est très utilisée pour I’ analyse de signaux, notamment lorsqu’on souhaite extraire des périodici- 
tés au sein d’un signal bruité. Le module NumPy possède la fonction fft() (dans le sous-module fft) permettant de calculer 
des transformées de Fourier. 

Voici un petit exemple sur la fonction cosinus de laquelle on souhaite extraire la période à l’aide de la fonction fft () : 


import numpy as np 


debut = -2 * np.pi 

fin = 2 * np.pi 

pas = 0.1 

x = np.arange (debut ,fin,pas) 
y = np.cos(x) 


TF = np.fft.fft(y) 

ABSTF = np.abs(TF) 

pas_xABSTF = 1/(fin-debut) 

x_ABSTF = np.arange(0,pas_xABSTF * len(ABSTF),pas_xABSTF) 


Plusieurs commentaires sur cet exemple : 

Ligne 1. On charge le module NumPy avec le nom raccourci np. 

Lignes 3 à 6. On définit l’intervalle (de —27 à 27 radians) pour les valeurs en abscisse ainsi que le pas (0,1 radians). 

Lignes 7. On calcule directement les valeurs en ordonnées avec la fonction cosinus du module NumPy. On constate ici que 
NumPy redéfinit certaines fonctions ou constantes mathématiques de base, comme pi, cos() ou abs() (valeur absolue, ou 
module d’un nombre complexe). Ces fonctions sont directement utilisables avec un objet array. 

Ligne 9. On calcule la transformée de Fourier avec la fonction fft () qui renvoie un vecteur (objet array à une dimension) 
de nombres complexes. Eh oui, le module NumPy gére aussi les nombres complexes ! 

Ligne 10. On extrait le module du résultat précédent avec la fonction abs (). 

Ligne 11. La variable x_ABSTFL représente l’abscisse du spectre (en radian”?). 

Ligne 12. La variable ABSTF contient le spectre lui même. L'analyse de ce dernier nous donne un pic à 0,15 radian™!, ce 
qui correspond bien à 27 (c’est plutôt bon signe de retrouver ce résultat). 


21.6 Sauvegardez votre historique de commandes 


Vous pouvez sauvegarder I’ historique des commandes utilisées dans l’interpréteur Python avec le module readline. 


>>> print ("hello") 


hello 

>>> a = 22 

>>> a = a + 11 
>>> print(a) 
33 


>>> import readline 
>>> readline.write_history_file() 


Quittez Python. L’historique de toutes vos commandes est dans votre répertoire personnel, dans le fichier .history. 
Relancez l’interpréteur Python. 


>>> import readline 
>>> readline.read_history_file() 
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Vous pouvez accéder aux commandes de la session précédente avec la flèche du haut de votre clavier. D’abord les com- 
mandes readline.read_history_file() et import readline de la session actuelle, puis print(a),a = a + 11,a = 
22... 
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Chapitre 22 
Mini-projets 


Dans ce chapitre, nous vous proposons quelques scénarios pour développer vos compétences en Python et mettre en ceuvre 
les concepts que vous avez rencontrés dans les chapitres précédents. 


22.1 Description des projets 


22.1.1 Mots anglais dans le protéome humain 


L'objectif de ce premier projet est de découvrir si des mots anglais peuvent se retrouver dans les séquences du protéome 
humain, c’est-à-dire dans les séquences de l’ensemble des protéines humaines. 
Vous aurez à votre disposition : 
— Le fichier english-common-words.txt !, qui contient les 3000 mots anglais les plus fréquents, à raison d’1 mot par 
ligne. 
— Le fichier human-proteome. fasta? qui contient le protéome humain sous la forme de séquences au format FASTA. 
Attention, ce fichier est assez gros. Ce fichier provient de la banque de données UniProt à partir de cette page °. 
Conseil : vous trouverez des explications sur le format FASTA et des exemples de code dans I’ annexe A Quelques formats 
de données rencontrés en biologie. 


22.1.2 Genbank2fasta 


Ce projet consiste a écrire un convertisseur de fichier, du format GenBank au format FASTA. 
Pour cela, nous allons utiliser le fichier GenBank du chromosome I de la levure de boulanger Saccharomyces cerevisiae. 
Vous pouvez télécharger ce fichier : 
— soit via le lien sur le site du cours NC_001133.gbk*; 
— soit directement sur la page de Saccharomyces cerevisiae S288c chromosome I, complete sequence” sur le site du 
NCBI puis en cliquant sur Send to, puis Complete Record, puis Choose Destination : File, puis Format : GenBank 
(full) et enfin sur le bouton Create File. 
Vous trouverez des explications sur les formats FASTA et GenBank ainsi que des exemples de code dans l’annexe A 
Quelques formats de données rencontrés en biologie. 
Vous pouvez réaliser ce projet sans ou avec des expressions réguliéres (abordées dans le chapitre 15). 


5 


22.1.3 Simulation d’un pendule 


On se propose de réaliser une simulation d’un pendule simple © en Tkinter. Un pendule simple est représenté par une 
masse ponctuelle (la boule du pendule) reliée à un pivot immobile par une tige rigide et sans masse. On néglige les effets 


. https://python.sdv.univ-paris-diderot.fr/data-files/english-common-words.txt 
. https://python.sdv.univ-paris-diderot.fr/data-files/human-proteome.fasta 
https://www.uniprot.org/help/human_proteome 
https://python.sdv.univ-paris-diderot.fr/data-files/NC_001133.gbk 
https://www.ncbi.nlm.nih.gov/nuccore/NC_001133 

. https://fr.wikipedia.org/wiki/Pendule_simple 
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x Pendule = x 


Demarrer 
Arréter 


theta dtheta 
(rad) (rad/dt) 
0.6 -5.4 


valeur 
initiale 
de theta 


Quitter 


FIGURE 22.1 — Application pendule. 


de frottement et on considère le champ gravitationnel comme uniforme. Le mouvement du pendule sera calculé en résolvant 
numériquement l’équation différentielle suivante : 


2 
aoli) = ZS (t) = —§ ssin(0(1)) 

où 0 représente l’angle entre la verticale et la tige du pendule, ag l’accélération angulaire, g la gravité, et / la longueur de 
la tige (note : pour la dérivation d’une telle équation vous pouvez consulter la page wikipedia’ ou l’accompagnement pas à 
pas, cf. la rubrique suivante). 

Pour trouver la valeur de O en fonction du temps, on pourra utiliser la méthode semi-implicite d'Euler* de résolution 
d’équation différentielle. La formule ci-dessus donne l’accélération angulaire au temps f: ag (t) =—$ x sin(@(t)). A partir de 
celle-ci, la méthode propose le calcul de la vitesse angulaire au pas suivant : vg (t + ôt) = ve (t) +ag(r) x dt (où ôt représente 
le pas de temps entre deux étapes successives de la simulation). Enfin, cette vitesse vg (1 + ôt) donne |’ angle 0 au pas suivant : 
O(t + ôt) = 0 (t) + vo (t + ôt) x St. On prendra un pas de temps ôt = 0.05 s, une accélération gravitationnelle g = 9.8 m.s~? et 
une longueur de tige de / = 1 m. 

Pour la visualisation, vous pourrez utiliser le widget canvas du module Tkinter (voir le chapitre 20 Fenêtres graphiques et 
Tkinter, rubrique Un canvas animé dans une classe). On cherche à obtenir un résultat comme montré dans la figure 22.4. 

Nous vous conseillons de procéder d’abord à la mise en place du simulateur physique (c’est-à-dire obtenir 0 en fonction 
du temps ou du pas de simulation). Faites par exemple un premier script Python qui produit un fichier à deux colonnes (temps 
et valeur de 0). Une fois que cela fonctionne bien, il vous faudra construire l’interface Tkinter et l’ animer. Vous pouvez ajouter 
un bouton pour démarrer / stopper le pendule et une règle pour modifier sa position initiale. 

N'oubliez pas, il faudra mettre dans votre programme final une fonction qui convertit l’angle O en coordonnées carté- 
siennes x et y dans le plan du canvas. Faites également attention au système de coordonnées du canvas où les ordonnées sont 
inversées par rapport à un repère mathématique. Pour ces deux aspects, reportez-vous à l’exercice Polygone de Sierpinski du 
chapitre 20 Fenêtres graphiques et Tkinter. 


22.2 Accompagnement pas à pas 


Vous trouverez ci-après les différentes étapes pour réaliser les mini-projets proposés. Prenez le temps de bien comprendre 
une étape avant de passer à la suivante. 


7. https://en.wikipedia.org/wiki/Pendulum_(mathematics)#math_Eq._1 
8. https://en.wikipedia.org/wiki/Euler_method 
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22.2.1 Mots anglais dans le protéome humain 


L'objectif de ce premier projet est de découvrir si des mots anglais peuvent se retrouver dans les séquences du protéome 
humain, c’est-à-dire dans les séquences de l’ensemble des protéines humaines. 


Composition aminée 


Dans un premier temps, composez 5 mots anglais avec les 20 acides aminés. 


Des mots 


Téléchargez le fichier english-common-words.txt ?. Ce fichier contient les 3000 mots anglais les plus fréquents, à raison 
d’1 mot par ligne. 

Créez un script words_in_proteome. py et écrivez la fonction read_words () qui va lire les mots contenus dans le fichier 
dont le nom est fourni en argument du script et renvoyer une liste contenant les mots convertis en majuscule et composés de 3 
caractères ou plus. 

Dans le programme principal, affichez le nombre de mots sélectionnés. 


Des protéines 


Téléchargez maintenant le fichier human-proteome.fasta !°. Attention, ce fichier est assez gros. Ce fichier provient de la 
banque de données UniProt à partir de cette page !!. 
Voici les premières lignes de ce fichier ([. . .] indique une coupure que nous avons faite) : 


>sp|095139|NDUB6_HUMAN NADH dehydrogenase [ubiquinone] 1 beta [...] 
MTGYTPDEKLRLQQLRELRRRWLKDQELSPREPVLPPQKMGPMEKFWNKFLENKSPWRKM 
VHGVYKKSIFVFTHVLVPVWIIHYYMKYHVSEKPYGIVEKKSRIFPGDTILETGEVIPPM 
KEFPDQHH 

>sp|075438|NDUB1_HUMAN NADH dehydrogenase [ubiquinone] 1 beta [...] 
MVNLLQIVRDHWVHVLVPMGFVIGCYLDRKSDERLTAFRNKSMLFKRELQPSEEVTWK 
>sp|Q8N4C6|NIN_HUMAN Ninein OS=Homo sapiens OX=9606 GN=NIN PE=1 SV=4 
MDEVEQDQHEARLKELFDSFDTTGTGSLGQEELTDLCHMLSLEEVAPVLQQTLLQDNLLG 
RVHFDQFKEALILILSRTLSNEEHFQEPDCSLEAQPKYVRGGKRYGRRSLPEFQESVEEF 
PEVTVIEPLDEEARPSHIPAGDCSEHWKTQRSEEYEAEGQLRFWNPDDLNASQSGSSPPQ 


Toujours dans le script words_in_proteome.py, écrivez la fonction read_sequences () qui va lire le protéome dans le 
fichier dont le nom est fourni en second argument du script. Cette fonction va renvoyer un dictionnaire dont les clefs sont les 
identifiants des protéines (par exemple, 095139, 075438, Q8N4C6) et dont les valeurs associées sont les séquences. 


Dans le programme principal, affichez le nombre de séquences lues. Á des fins de test, affichez également la séquence 
associée à la protéine 095139. 


À la pêche aux mots 


Écrivez maintenant la fonction search_words_in_proteome() qui prend en argument la liste de mots et le dictionnaire 
contenant les séquences des protéines et qui va compter le nombre de séquences dans lesquelles un mot est présent. Cette 
fonction renverra un dictionnaire dont les clefs sont les mots et les valeurs le nombre de séquences qui contiennent ces mots. 
La fonction affichera également le message suivant pour les mots trouvés dans le protéome : 


ACCESS found in 1 sequences 
ACID found in 38 sequences 
ACT found in 805 sequences 


Esos] 


Cette étape prend quelques minutes. Soyez patient. 


Et le mot le plus fréquent est... 


Pour terminer, écrivez maintenant la fonction find_most_frequent_word() qui prend en argument le dictionnaire ren- 
voyé par la précédente fonction search_words_in_proteome() et qui affiche le mot trouvé dans le plus de protéines, ainsi 
que le nombre de séquences dans lesquelles il a été trouvé, sous la forme : 


=> xxx found in yyy sequences 


9. https: //python.sdv.univ-paris-diderot.fr/data-files/english-common-words.txt 
10. https: //python.sdv.univ-paris-diderot.fr/data-files/human-proteome.fasta 
11. https: //www.uniprot.org/help/human_proteome 
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Quel est ce mot ? 
Quel pourcentage des séquences du protéome contiennent ce mot ? 


Pour être plus complet 


Jusqu’à présent, nous avions déterminé, pour chaque mot, le nombre de séquences dans lesquelles il apparaissait. Nous 
pourrions aller plus loin et calculer aussi le nombre de fois que chaque mot apparaît dans les séquences. 

Pour cela modifier la fonction search_words_in_proteome() de façon à compter le nombre d’occurrences d’un mot 
dans les séquences. La méthode . count () vous sera utile. 

Déterminez alors quel mot est le plus fréquent dans le protéome humain. 


22.2.2 genbank2fasta (sans expression régulière) 


Ce projet consiste à écrire un convertisseur de fichier, du format GenBank au format FASTA. L’annexe A Quelques formats 
de données rencontrés en biologie rappelle les caractéristiques de ces deux formats de fichiers. 

Le jeu de données avec lequel nous allons travailler est le fichier GenBank du chromosome I de la levure du boulanger 
Saccharomyces cerevisiae. Les indications pour le télécharger sont indiqués dans la description du projet. 

Dans cette rubrique, nous allons réaliser ce projet sans expression régulière. 


Lecture du fichier 


Créez un script genbank2fasta. py et créez la fonction 1it_fichier() qui prend en argument le nom du fichier et qui 
renvoie le contenu du fichier sous forme d’une liste de lignes, chaque ligne étant elle-même une chaîne de caractères. 
Testez cette fonction avec le fichier GenBank NC_001133. gbk et affichez le nombre de lignes lues. 


Extraction du nom de l’organisme 


Dans le méme script, ajoutez la fonction extrait_organisme() qui prend en argument le contenu du fichier précédem- 
ment obtenu avec la fonction 1it_fichier() (sous la forme d’une liste de lignes) et qui renvoie le nom de l’ organisme. Pour 
récupérer la bonne ligne vous pourrez tester si les premiers caractéres de la ligne contiennent le mot-clé ORGANISM. 

Testez cette fonction avec le fichier GenBank NC_001133. gbk et affichez le nom de l’organisme. 


Recherche des génes 


Dans le fichier GenBank, les gènes sens sont notés de cette manière : 
gene 58..272 


ou 
gene <2480..>2707 


et les gènes antisens (ou encore complémentaires) de cette façon : 
gene complement (55979. .56935) 


ou 
gene complement (<13363..>13743) 


Les valeurs numériques séparées par . . indiquent la position du gène dans le génome (numéro de la première base, numéro 
de la dernière base). 


Remarque 

Le symbole < indique un gène partiel sur l’extrémité 5’, c’est-à-dire que le codon START correspondant est incomplet. 
Respectivement, le symbole > désigne un gène partiel sur l’extrémité 3’, c’est-à-dire que le codon STOP correspondant est 
incomplet. Pour plus de détails, consultez la documentation du NCBI sur les délimitations des gènes !?. Nous vous proposons 
ici d'ignorer ces symboles > et <. 


Repérez ces différents gènes dans le fichier NC_001133.gbk. Pour récupérer ces lignes de gènes il faut tester si la ligne 
commence par 


12. https://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html#BaseSpanB 
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gene 


(c’est-à-dire 5 espaces, suivi du mot gene, suivi de 12 espaces). Pour savoir s’il s’agit d’un gène sur le brin direct ou 
complémentaire, il faut tester la présence du mot complement dans la ligne lue. 
Ensuite si vous souhaitez récupérer la position de début et de fin de gène, nous vous conseillons d’utiliser la fonction 
replace() et de ne garder que les chiffres et les . Par exemple 
gene <2480..>2707 


sera transformé en 
2480..2707 


Enfin, avec la méthode .split() vous pourrez facilement récupérer les deux entiers de début et de fin de gène. 

Dans le même script genbank2fasta. py, ajoutez la fonction recherche_genes() qui prend en argument le contenu du 
fichier (sous la forme d’une liste de lignes) et qui renvoie la liste des gènes. 

Chaque gène sera lui-même une liste contenant le numéro de la première base, le numéro de la dernière base et une chaîne 
de caractère "sens" pour un gène sens et "antisens" pour un gène antisens. 

Testez cette fonction avec le fichier GenBank NC_001133. gbk et affichez le nombre de gènes trouvés, ainsi que le nombre 
de gènes sens et antisens. 


Extraction de la séquence nucléique du génome 


La taille du génome est indiqué sur la première ligne d’un fichier GenBank. Trouvez la taille du génome stocké dans le 
fichier NC_001133.gbk. 
Dans un fichier GenBank, la séquence du génome se trouve entre les lignes 
ORIGIN 


et 
// 


Trouvez dans le fichier NC_001133.gbk la première et dernière ligne de la séquence du génome. 
Pour récupérer les lignes contenant la séquence, nous vous proposons d’utiliser un algorithme avec un drapeau is_dnaseq 
(qui vaudra True ou False). Voici l’algorithme proposé en pseudo-code : 


is_dnaseq <- False 
Lire chaque ligne du fichier gbk 
si la ligne contient "//" 


is_dnaseq <- False 

si is_dnaseq vaut True 
accumuler la séquence 

si la ligne contient "ORIGIN" 
is_dnaseq <- True 

Au début ce drapeau aura la valeur False. Ensuite, quand il se mettra à True, on pourra lire les lignes contenant la 
séquence, puis quand il se remettra à False on arrêtera. 

Une fois la séquence récupérée, il suffira d’éliminer les chiffres, retours chariots et autres espaces (Conseil : calculer la 
longueur de la séquence et comparer la à celle indiquée dans le fichier gbk). 

Toujours dans le même script genbank2fasta.py, ajoutez la fonction extrait_sequence() qui prend en argument 
le contenu du fichier (sous la forme de liste de lignes) et qui renvoie la séquence nucléique du génome (dans une chaîne de 
caractères). La séquence ne devra pas contenir d’espaces, ni de chiffres ni de retours chariots. 

Testez cette fonction avec le fichier GenBank NC_001133.gbk et affichez le nombre de bases de la séquence extraite. 
Vérifiez que vous n’avez pas fait d’erreur en comparant la taille de la séquence extraite avec celle que vous avez trouvée dans 
le fichier GenBank. 


Construction d’une séquence complémentaire inverse 


Toujours dans le même script, ajoutez la fonction construit_comp_inverse() qui prend en argument une séquence 
d’ADN sous forme de chaîne de caractères et qui renvoie la séquence complémentaire inverse (également sous la forme d’une 
chaîne de caractères). 

On rappelle que construire la séquence complémentaire inverse d’une séquence d’ ADN consiste à : 

— Prendre la séquence complémentaire. C’est-à-dire à remplacer la base a par la base t, t par a, c par g et g par c. 

— Prendre l’inverse. C’est-à-dire à que la première base de la séquence complémentaire devient la dernière base et 

réciproquement, la dernière base devient la première. 


Cours de Python / Université de Paris / UFR Sciences du Vivant 


22.2. Accompagnement pas à pas Chapitre 22. Mini-projets 


Pour vous faciliter le travail, ne travaillez que sur des séquences en minuscule. 
Testez cette fonction avec les séquences atcg, AATTCCGG et gattaca. 


Écriture d’un fichier FASTA 


Toujours dans le même script, ajoutez la fonction ecrit_fasta() qui prend en argument un nom de fichier (sous forme 
de chaîne de caractères), un commentaire (sous forme de chaîne de caractères) et une séquence (sous forme de chaîne de 
caractères) et qui écrit un fichier FASTA. La séquence sera à écrire sur des lignes ne dépassant pas 80 caractères. 

Pour rappel, un fichier FASTA suit le format suivant : 


>commentaire 

sequence sur une ligne de 80 caractères maxi 
suite de la séquence ecese es ee eRe ea 
suite de lá séquence wii vin ea ne ane ee ee ed 


Testez cette fonction avec : 

— nom de fichier : test.fasta 

— commentaire : mon commentaire 

— séquence : atcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcg 


Extraction des gènes 


Toujours dans le même script, ajoutez la fonction extrait_genes() qui prend en argument la liste des gènes, la sé- 
quence nucléotidique complète (sous forme d’une chaîne de caractères) et le nom de l’organisme (sous forme d’une chaîne de 
caractères) et qui pour chaque gène : 

— extrait la séquence du gène dans la séquence complète ; 

— prend la séquence complémentaire inverse (avec la fonction construit _comp_inverse() si le gène est antisens ; 

— enregistre le gène dans un fichier au format FASTA (avec la fonction ecrit_fasta()); 

— affiche à l’écran le numéro du gène et le nom du fichier FASTA créé. 

La première ligne des fichiers FASTA sera de la forme : 


>nom-organisme|numéro-du-géne|début|fin|sens ou antisens 


Le numéro du gène sera un numéro consécutif depuis le premier gène jusqu’au dernier. Il n’y aura pas de différence de 
numérotation entre les gènes sens et les gènes antisens. 
Testez cette fonction avec le fichier GenBank NC_001133.gbk. 


Assemblage du script final 


Pour terminer, modifiez le script genbank2fasta.py de façon à ce que le fichier GenBank à analyser (dans cet exemple 
NC_001133.gbk), soit entré comme argument du script. 

Vous afficherez un message d’ erreur si : 

— le script genbank2fasta.py est utilisé sans argument, 

— le fichier fourni en argument n’existe pas. 

Pour vous aider, n’hésitez pas à jeter un ceil aux descriptions des modules sys et os dans le chapitre 8 Modules. 

Testez votre script ainsi finalisé. 

Bravo, si vous êtes arrivés jusqu’à cette étape. 


22.2.3 genbank2fasta (avec expressions régulières) 


Ce projet consiste à écrire un convertisseur de fichier, du format GenBank au format FASTA. L’annexe A Quelques formats 
de données rencontrés en biologie rappelle les caractéristiques de ces deux formats de fichiers. 

Le jeu de données avec lequel nous allons travailler est le fichier GenBank du chromosome I de la levure du boulanger 
Saccharomyces cerevisiae. Les indications pour le télécharger sont indiqués dans la description du projet. 

Dans cette rubrique, nous allons réaliser ce projet avec des expressions régulières en utilisant le module re. 
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Lecture du fichier 


Créez un script genbank2fasta. py et créez la fonction 1it_fichier() qui prend en argument le nom du fichier et qui 
renvoie le contenu du fichier sous forme d’une liste de lignes, chaque ligne étant elle-même une chaîne de caractères. 
Testez cette fonction avec le fichier GenBank NC_001133. gbk et affichez le nombre de lignes lues. 


Extraction du nom de l’organisme 


Dans le même script, ajoutez la fonction extrait_organisme() qui prend en argument le contenu du fichier précédem- 
ment obtenu avec la fonction lit_fichier() (sous la forme d’une liste de lignes) et qui renvoie le nom de l’organisme. 
Utilisez de préférence une expression régulière. 

Testez cette fonction avec le fichier GenBank NC_001133. gbk et affichez le nom de l’organisme. 


Recherche des génes 


Dans le fichier GenBank, les gènes sens sont notés de cette manière : 
gene 58..272 


ou 
gene <2480..>2707 


et les gènes antisens de cette façon : 


gene complement (55979. .56935) 


ou 
gene complement (<13363..>13743) 


Les valeurs numériques séparées par . . indiquent la position du gène dans le génome (numéro de la première base, numéro 
de la dernière base). 


Remarque 

Le symbole < indique un gène partiel sur l’extrémité 5’, c’est-à-dire que le codon START correspondant est incomplet. 
Respectivement, le symbole > désigne un gène partiel sur l’extrémité 3’, c’est-à-dire que le codon STOP correspondant est 
incomplet. Pour plus de détails, consultez la documentation du NCBI sur les délimitations des gènes '?. 


Repérez ces différents gènes dans le fichier NC_001133.gbk. Construisez deux expressions régulières pour extraire du 
fichier GenBank les gènes sens et les gènes antisens. 

Modifiez ces expressions régulières pour que les numéros de la première et de la dernière base puissent être facilement 
extraits. 

Dans le même script genbank2fasta. py, ajoutez la fonction recherche_genes() qui prend en argument le contenu du 
fichier (sous la forme d’une liste de lignes) et qui renvoie la liste des gènes. 

Chaque gène sera lui-même une liste contenant le numéro de la première base, le numéro de la dernière base et une chaîne 
de caractère "sens" pour un gène sens et "antisens" pour un gène antisens. 

Testez cette fonction avec le fichier GenBank NC_001133. gbk et affichez le nombre de gènes trouvés, ainsi que le nombre 
de gènes sens et antisens. 


Extraction de la séquence nucléique du génome 


La taille du génome est indiqué sur la première ligne d’un fichier GenBank. Trouvez la taille du génome stocké dans le 
fichier NC_001133.gbk. 
Dans un fichier GenBank, la séquence du génome se trouve entre les lignes 


ORIGIN 


et 
El 


13. https: //ww.ncbi.nlm.nih.gov/Sitemap/samplerecord.htmlitBaseSpanB 
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Trouvez dans le fichier NC_001133. gbk la première et dernière ligne de la séquence du génome. 

Construisez une expression régulière pour extraire du fichier GenBank les lignes correspondantes à la séquence du génome. 

Modifiez ces expressions régulières pour que la séquence puisse être facilement extraite. 

Toujours dans le même script, ajoutez la fonction extrait _sequence() qui prend en argument le contenu du fichier 
(sous la forme de liste de lignes) et qui renvoie la séquence nucléique du génome (dans une chaîne de caractères). La séquence 
ne devra pas contenir d'espaces. 

Testez cette fonction avec le fichier GenBank NC_001133.gbk et affichez le nombre de bases de la séquence extraite. 


Vérifiez que vous n’avez pas fait d’erreur en comparant la taille de la séquence extraite avec celle que vous avez trouvée dans 
le fichier GenBank. 


Construction d’une séquence complémentaire inverse 


Toujours dans le même script, ajoutez la fonction construit_comp_inverse() qui prend en argument une séquence 
d’ADN sous forme de chaîne de caractères et qui renvoie la séquence complémentaire inverse (également sous la forme d’une 
chaîne de caractères). 

On rappelle que construire la séquence complémentaire inverse d’une séquence d’ ADN consiste à : 

— Prendre la séquence complémentaire. C’est-à-dire à remplacer la base a par la base t, t par a, c par g et g parc. 

— Prendre l’inverse. C’est-à-dire à que la première base de la séquence complémentaire devient la dernière base et 

réciproquement, la dernière base devient la première. 

Pour vous faciliter le travail, ne travaillez que sur des séquences en minuscule. 


Testez cette fonction avec les séquences atcg, AATTCCGG et gattaca. 


Écriture d’un fichier FASTA 


Toujours dans le même script, ajoutez la fonction ecrit_fasta() qui prend en argument un nom de fichier (sous forme 
de chaîne de caractères), un commentaire (sous forme de chaîne de caractères) et une séquence (sous forme de chaîne de 
caractères) et qui écrit un fichier FASTA. La séquence sera à écrire sur des lignes ne dépassant pas 80 caractères. 

Pour rappel, un fichier FASTA suit le format suivant : 


>commentaire 

sequence sur une ligne de 80 caractères maxi 
suite de la séquence 4,4 su kaa ea a. 
suite dë La Séquence, 6 ssw Ke Heed ER EAR ER 


Testez cette fonction avec : 

— nom de fichier : test .fasta 

— commentaire : mon commentaire 

— séquence : atcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcpgatcgatcgatcgatcgatcgatcgatcgatcgatcgatcg, 


Extraction des gènes 


Toujours dans le même script, ajoutez la fonction extrait_genes() qui prend en argument la liste des gènes, la sé- 
quence nucléotidique complète (sous forme d’une chaîne de caractères) et le nom de l’organisme (sous forme d’une chaîne de 
caractères) et qui pour chaque gène : 

— extrait la séquence du gène dans la séquence complète ; 

— prend la séquence complémentaire inverse (avec la fonction construit _comp_inverse() si le gène est antisens ; 

— enregistre le gène dans un fichier au format FASTA (avec la fonction ecrit_fasta()); 

— affiche à l’écran le numéro du gène et le nom du fichier fasta créé. 

La première ligne des fichiers FASTA sera de la forme : 


>nom-organisme|numéro-du-géne|début|fin|sens ou antisens 


Le numéro du gène sera un numéro consécutif depuis le premier gène jusqu’au dernier. Il n’y aura pas de différence de 
numérotation entre les gènes sens et les gènes antisens. 
Testez cette fonction avec le fichier GenBank NC_001133.gbk. 
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Assemblage du script final 


Pour terminer, modifiez le script genbank2fasta.py de façon à ce que le fichier GenBank à analyser (dans cet exemple 
NC_001133.gbk), soit entré comme argument du script. 

Vous afficherez un message d’erreur si : 

— le script genbank2fasta. py est utilisé sans argument, 

— le fichier fourni en argument n’existe pas. 

Pour vous aider, n’hésitez pas à jeter un œil aux descriptions des modules sys et os dans le chapitre 8 sur les modules. 

Testez votre script ainsi finalisé. 


22.2.4 Simulation d’un pendule 


L'objectif de ce projet est de simuler un pendule simple '* en 2 dimensions, puis de le visualiser à l’aide du module tkinter. 
Le projet peut s’avérer complexe. Tout d’abord, il y a l’aspect physique du projet. Nous allons faire ici tous les rappels de 
mécanique nécessaires à la réalisation du projet. Ensuite, il y a la partie fkinter qui n’est pas évidente au premier abord. Nous 
conseillons de bien séparer les deux parties. D’abord réaliser la simulation physique et vérifier qu’elle fonctionne (par exemple, 
en écrivant un fichier de sortie permettant cette vérification). Ensuite passer à la partie graphique tkinter si et seulement si la 
première partie est fonctionnelle. 


Mécanique d’un pendule simple 


Nous allons décrire ici ce dont nous avons besoin concernant la mécanique d’un pendule simple. Notamment, nous allons 
vous montrer comment dériver l’équation différentielle permettant de calculer la position du pendule à tout moment en fonction 
des conditions initiales. Cette page est largement inspirée de la page Wikipedia en anglais '?. Dans la suite, une grandeur 
représentée en gras, par exemple P, représente un vecteur avec deux composantes dans le plan 2D (P,,P,). Cette notation en 
gras est équivalente à la notation avec une flèche au dessus de la lettre. La même grandeur représentée en italique, par exemple 
P, représente le nombre scalaire correspondant. Ce nombre peut être positif ou négatif, et sa valeur absolue vaut la norme du 
vecteur. 

Un pendule simple est représenté par une masse ponctuelle (la boule du pendule) reliée à un axe immobile par une tige 
rigide et sans masse. Le pendule simple est un système idéal. Ainsi, on néglige les effets de frottement et on considère le 
champ gravitationnel comme uniforme. La figure 22.2 montre un schéma du système ainsi qu’un bilan des forces agissant sur 
la masse. Les deux forces agissant sur la boule sont son poids P et la tension T due à la tige. 

La figure 22.3 montre un schéma des différentes grandeurs caractérisant le pendule. La coordonnée naturelle pour définir 
la position du pendule est l’angle 6. Nous verrons plus tard comment convertir cet angle en coordonnées cartésiennes pour 
l'affichage dans un canvas tkinter. Nous choisissons de fixer 8 = 0 lorsque le pendule est à sa position d’équilibre. Il s’agit 
de la position où la boule est au plus bas. C’est une position à laquelle le pendule ne bougera pas s’il n’a pas une vitesse 
préexistante. Nous choisissons par ailleurs de considérer € positif lorsque le pendule se balance à droite, et négatif de l’autre 
côté. g décrit l’accélération due à la gravité, avec P = mg, ou si on raisonne en scalaire P = mg. Les deux vecteurs représentant 
les composantes tangentielle et orthogonale au mouvement du pendule de P sont représentées sur le schéma (les annotations 
indiquent leur norme). 

Si on déplace le pendule de sa position d’équilibre, il sera mû par la force F résultant de la tension T et de son poids 
P (cf. plus bas). Comme le système est considéré comme parfait (pas de frottement, gravité uniforme, etc.), le pendule ne 
s’arrêtera jamais. Si on le monte à O = +20 deg et qu’on le lâche, le pendule redescendra en passant par 0 = 0 deg, remontera 
de l’autre côté à 0 = —20 deg, puis continuera de la sorte indéfiniment, grâce à la conservation de l’énergie dans un système 
fermé (c’est-à-dire sans « fuite » d’ énergie). 

Ici, on va tenter de simuler ce mouvement en appliquant les lois du mouvement de Newton '° et en résolvant les équations 
correspondantes numériquement. D’après la seconde loi de Newton, la force (F) agissant sur la boule est égale à sa masse (m) 
fois son accélération (a) : 


F = ma 


Cette loi est exprimée ici dans le système de coordonnées cartésiennes (le plan à 2 dimensions). La force F et l’accélération 
a sont des vecteurs dont les composantes sont respectivement (Fy, Fy) et (a,,a,). La force F correspond à la somme vectorielle 


14. https://fr.wikipedia.org/wiki/Pendule_simple 
15. https://en.wikipedia.org/wiki/Pendulum_ (mathematics) 
16. https://fr.wikipedia.org/wiki/Lois_du_mouvement _de_Newton 
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FIGURE 22.2 — Bilan des forces dans un pendule simple. 
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FIGURE 22.3 — Caractérisation géométrique d’un pendule simple. 
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de T et P. La tige du pendule étant rigide, le mouvement de la boule est restreint sur le cercle de rayon égal à la longueur 
L de la tige (dessiné en pointillé). Ainsi, seule la composante tangentielle de l’accélération a sera prise en compte dans ce 
mouvement. Comment la calculer ? La force de tension T étant orthogonale au mouvement du pendule, celle-ci n’aura pas 
d'effet. De même, la composante orthogonale mgcos@ due au poids P n’aura pas d’effet non plus. Au final, on ne prendra en 
compte que la composante tangentielle due au poids, c’est-à-dire mgsin@ (cf. figure 22.3). Au final, on peut écrire l’expression 
suivante en raisonnant sur les valeurs scalaires : 


F = ma = —mgsin0 


Le signe — dans cette formule est très important. Il indique que l’accélération s’oppose systématiquement à 6. Si le 
pendule se balance vers la droite et que O devient plus positif, l’accélération tendra toujours à faire revenir la boule dans 
l’autre sens vers sa position d’équilibre à 0 = 0. On peut faire un raisonnement équivalent lorsque le pendule se balance vers 
la gauche et que 6 devient plus négatif. 

Si on exprime l'accélération en fonction de 6, on trouve ce résultat qui peut sembler peu intuitif au premier abord : 


a = —gsin0 


Le mouvement du pendule ne dépend pas de sa masse! 
Idéalement, nous souhaiterions résoudre cette équation en l’exprimant en fonction de O seulement. Cela est possible en 
reliant O à la longueur effective de l’arc s parcourue par le pendule : 


s = OL 


Pour bien comprendre cette formule, souvenez-vous de la formule bien connue du cercle / = 27r (où / est la circonférence, 
et r le rayon)! Elle relie la valeur de O à la distance de l’arc entre la position actuelle de la boule et l’origine (à 8 = 0). On 
peut donc exprimer la vitesse du pendule en dérivant s par rapport au temps t : 


ds d0 
y = — = L— 
dt dt 
On peut aussi exprimer I’ accélération a en dérivant l’arc s deux fois par rapport à t : 
s de 
d= —> = — 
dt? dt? 


A nouveau, cette dernière formule exprime |’ accélération de la boule lorsque le mouvement de celle-ci est restreint sur le 
cercle pointillé. Si la tige n’était pas rigide, l’expression serait différente. 
Si on remplace a dans la formule ci-dessus, on trouve : 
d?0 
L— = —gsin0 
dt? sd 
Soit en remaniant, on trouve l’équation différentielle en O décrivant le mouvement du pendule : 
dO g 
=> + Tsin0 =0 
d? L 
Dans la section suivante, nous allons voir comment résoudre numériquement cette équation différentielle. 


Résolution de l’équation différentielle du pendule 


Il existe de nombreuses méthodes numériques de résolution d’équations différentielles !”. L’ objet ici n'est pas de faire un 
rappel sur toutes ces méthodes ni de les comparer, mais juste d’expliquer une de ces méthodes fonctionnant efficacement pour 
simuler notre pendule. 

Nous allons utiliser la méthode semi-implicite d’Euler !8. Celle-ci est relativement intuitive à comprendre. 

Commençons d’abord par calculer l’accélération angulaire ag au temps f en utilisant l’équation différentielle précédem- 
ment établie : 


d?0 g. 
= a) = —7sin8(t) 


17. https://en.wikipedia. org/wiki/Numerical_methods_for_ordinary_differential_equations 
18. https://en.wikipedia. org/wiki/Semi-implicit_Euler_method 


ag(t) 
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L’astuce sera de calculer ensuite la vitesse angulaire au pas suivant + dt grâce à la relation : 


d0 

ve(t + ôt) = — 

a(t +61) = E 

Cette équation est ni plus ni moins qu’un remaniement de la définition de l’accélération, à savoir, la variation de vitesse 
par rapport à un temps. Cette vitesse vg(t + ôt) permettra au final de calculer O au temps 1 + ôt (c’est-à-dire ce que l’on 


cherche !) : 


(t+ dt) = va(r) +a@(t) x ôt 


O(t + dt) = O(t) + volt +01) x dt 


Dans une réalisation algorithmique, il suffira d’initialiser les variables de notre système puis de faire une boucle sur un 
nombre de pas de simulation. A chaque pas, on calculera ag(t), puis va(r + ôt) et enfin O(t + ôt) à l’aide des formules 
ci-dessus. 

L initialisation des variables pourra ressembler à cela : 


L <- 1 # longueur tige en m 

g <- 9.8 tt accélération gravitationnelle en m/s°2 
t <- 0 # temps initial en s 

dt <- 0.05 # pas de temps en s 


# conditions initiales 
theta <- pi / 4 # angle initial en rad 
dtheta <- 0 # vitesse angulaire initiale en rad/s 


afficher_position_pendule(t, theta) # afficher position de départ 


D'initialisation des valeurs de theta et dtheta est très importante car elle détermine le comportement du pendule. Nous 
avons choisi ici d’avoir une vitesse angulaire nulle et un angle de départ du pendule O = 7/4 rad = 45 deg. Le pas dt est 
également très important, c’est lui qui déterminera l’erreur faite sur l'intégration de l’ équation différentielle. Plus ce pas est 
petit, plus on est précis, mais plus le calcul sera long. Ici, on choisit un pas dt de 0.05 s qui constitue un bon compromis. 
À ce stade, vous avez tous les éléments pour tester votre pendule. Essayez de réaliser un petit programme python pendule_basic.py 
qui utilise les conditions initiales ci-dessus et simule le mouvement du pendule. A la fin de cette rubrique, nous proposons 
une solution en langage algorithmique. Essayez dans un premier temps de le faire vous-même. A chaque pas, le programme 
écrira le temps ¢ et l’angle O dans un fichier pendule_basic.dat. Dans les équations, @ doit être exprimé en radian, mais 
nous vous conseillons de convertir cet angle en degré dans le fichier (plus facile à comprendre pour un humain !). Une fois ce 
fichier généré, vous pourrez observer le graphe correspondant avec matplotlib en utilisant le code suivant : 


import matplotlib.pyplot as plt 
import numpy as np 


# la fonction np.genfromtxt() renvoie un array à 2 dim 
array_data = np.genfromtxt ("pendule_basic.dat") 

# col 0: t, col 1: theta 

t = array_datal:,0] 

theta = array_datal:,1] 


# plot 

plt.figure(figsize=(8,8)) 

mini = min(theta) * 1.2 

maxi = max(theta) * 1.2 
plt.xlim(O, max(t)) 
plt.ylim(mini, maxi) 
plt.xlabel("t (s)") 
plt.ylabel("theta (deg)") 
plt.plot(t, theta) 
plt.savefig("pendule_basic. png") 


Si vous observez une sinusoide, bravo, vous venez de réaliser votre première simulation de pendule ! Vous avez maintenant 
le « squelette » de votre « moteur » de simulation. N’hésitez pas à vous amuser avec d’autres conditions initiales. Ensuite vous 
pourrez passer à la rubrique suivante. 

Si vous avez bloqué dans l’écriture de la boucle, voici à quoi elle pourrait ressembler en langage algorithmique : 


tant qu'on n'arrête pas le pendule: 
tt acc angulaire au tps t (en rad/s”2) 
d2theta <- -(g/L) * sin(theta) 
# v angulaire mise à jour de t -> t + dt 
dtheta <- dtheta + d2theta * dt 
# theta mis à jour de t -> t + dt 
theta <- theta + dtheta * dt 
# t mis à jour 
t <- t + dt 
# mettre à jour l'affichage 
afficher _position_pendule(t, theta) 
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x Pendule = x 


Demarrer 
Arréter 


theta dtheta 
(rad) (rad/dt) 
0.6 -5.4 
valeur 
initiale 
de theta 
2.356 


Quitter 


FIGURE 22.4 — Application pendule. 


Constructeur de l’application en tkinter 


Nous allons maintenant construire l’application tkinter en vous guidant pas à pas. Il est bien sûr conseillé de relire le 
chapitre 20 sur tkinter avant de vous lancer dans cette partie. 


Comme expliqué largement dans le chapitre 20, nous allons construire |’ application avec une classe. Le programme prin- 
cipal sera donc très allégé et se contentera d'instancier |’ application, puis de lancer le gestionnaire d’ événements : 


if __name__ == "__main__": 
"""Programme principal (instancie la classe principale, donne un 
titre et lance le gestionnaire d'événements) 
nun 
app_pendule = AppliPendule() 
app_pendule.title ("Pendule") 


app_pendule.mainloop() 


Ensuite, nous commençons par écrire le constructeur de la classe. Dans ce constructeur, nous aurons une section initialisant 
toutes les variables utilisées pour simuler le pendule (cf. rubrique précédente), puis, une autre partie générant les widgets et 
tous les éléments graphiques. Nous vous conseillons vivement de bien les séparer, et surtout de mettre des commentaires 
pour pouvoir s’y retrouver. Voici un « squelette » pour vous aider : 


| class AppliPendule(tk.Tk): 
] def __init__(self): 
# instanciation de la classe Tk 
tk.Tk.__init__(self) 
# ici vous pouvez définir toutes les variables 
# concernant la physique du pendule 
self.theta = np.pi / 4 # valeur intiale theta 
self.dtheta = 0 # vitesse angulaire initiale 
o| Lies] 
o| self.g = 9.8 # cst gravitationnelle en m/s^2 
1| Deed 
12| # ici vous pouvez construire l'application graphique 
| self.canv = tk.Canvas(self, bg='gray', height=400, width=400) 
# création d'un boutton demarrer, arreter, quitter 
# penser à placer les widgets avec .pack() 


| C...] 


La figure 22.4 vous montre un aperçu de ce que l’on voudrait obtenir. 

Pour le moment, vous pouvez oublier la réglette fixant la valeur initiale de 6, les labels affichant la valeur de 0 et vg ainsi 
que les points violets « laissés en route » par le pendule. De même, nous dessinerons le pivot, la boule et la tige plus tard. A 
ce stade, il est fondamental de tout de suite lancer votre application pour vérifier que les widgets sont bien placés. N’oubliez 
pas, un code complexe se teste au fur et à mesure lors de son développement. 
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Conseil : pour éviter un message d’erreur si toutes les méthodes n’existe pas encore, vous pouvez indiquer command=self.quit 
pour chaque bouton (vous le changerez après). 


Créations des dessins dans le canvas 


Le pivot et la boule pourront être créés avec la méthode .create_oval(), la tige le sera avec la méthode .create_line(). 
Pensez à créer des variables pour la tige et la boule lors de l’instanciation car celles-ci bougeront par la suite. 

Comment placer ces éléments dans le canvas? Vous avez remarqué que lors de la création de ce dernier, nous avons fixé 
une dimension de 400 x 400 pixels. Le pivot se trouve au centre, c’est-à-dire au point (200,200) . Pour la tige et la boule il 
sera nécessaire de connaître la position de la boule dans le repère du canvas. Or, pour |’instant, nous définissons la position 
de la boule avec l’angle 6. Il va donc nous falloir convertir © en coordonnées cartésiennes (x,y) dans le repère mathématique 
défini dans la figure 22.3, puis dans le repère du canvas (xc, ye) (cf. rubrique suivante). 


Conversion de O en coordonnées (x,y) Cette étape est relativement simple si on considère le pivot comme le centre du 
repère. Avec les fonctions trigonométriques sin() et cos(), vous pourrez calculer la position de la boule (cf. exercice sur la 
spirale dans le chapitre 7). Faites attention toutefois aux deux aspects suivants : 
— la trajectoire de la boule suit les coordonnées d’un cercle de rayon L (si on choisit L = 1 m, ce sera plus simple); 
— nous sommes décalés par rapport au cercle trigonométrique classique ; si on considère L = 1 m: 
— quand 0 — 0, on a le point (0, —1) (pendule en bas); 
— quand 0 = +7/2 = 90 deg, on a (1,0) (pendule à droite) ; 
— quand 0 = — 7/2 = —90 deg, on a (—1,0) (pendule à gauche); 
— quand 0 = +z = +180 deg, on a (0,1) (pendule en haut). 
La figure 22.3 montre graphiquement les valeurs de 6. 
Si vous n’avez pas trouvé, voici la solution : 


np.sin(self.theta) * self.L 
-np.cos(self.theta) * self.L 


self.x 
self.y 


Conversion des coordonnées (x,y) en (x,,y-) Il nous faut maintenant convertir les coordonnées naturelles mathématiques 
du pendule (x,y) en coordonnées dans le canvas (xe, Yc). Plusieurs choses sont importantes pour cela : 
— le centre du repère mathématique (0,0) a la coordonnée (200,200) dans le canvas ; 
— il faut choisir un facteur de conversion : par exemple, si on choisit L = 1 m, on peut proposer le facteur 1 m — 100 
pixels; 
— l’axe des ordonnées dans le canvas est inversé par rapport au repère mathématique. 


Conseil 
Dans votre classe, cela peut étre une bonne idée d’écrire une méthode qui réalise cette conversion. Celle-ci pourrait 
s’appeler par exemple map_realcoor2canvas(). 


Si vous n’avez pas trouvé, voici la solution : 


self.conv_factor = 100 
self.x_c = self.x*self.conv_factor + 200 
self.y_c = -self.y*self.conv_factor + 200 


Gestion des boutons 


Il reste maintenant a gérer les boutons permettant de démarrer / stopper le pendule. Pour cela il faudra créer 3 méthodes 
dans notre classe : 
— la méthode .start () : met en mouvement le pendule; si le pendule n’a jamais été en mouvement, il part de son point 
de départ ; si le pendule avait déjà été en mouvement, celui-ci repart d’où on l’avait arrêté (avec la vitesse qu'il avait à 
ce moment 1a); 
— la méthode .stop() : arrête le mouvement du pendule; 
— la méthode .move() : gère le mouvement du pendule (génère les coordonnées du pendule au pas suivant). 
Le bouton « Démarrer » appellera la méthode . start (), le bouton « Arrêter » appellera la méthode .stop() et le bouton 
« Quitter » quittera l’ application. Pour lier une action au clic d’un bouton, on se souvient qu'il faut donner a l’argument par 
mot-clé command une callback (c’est-à-dire le nom d’une fonction ou méthode sans les parenthèses) : 
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— btni = tk.Button(self, text="Quitter", command=self.quit) 
— btn2 = tk.Button(self, text="Demarrer", command=self.start) 
— btn3 = tk.Button(self, text="Arréter", command=self.stop) 


Ici, self .start() et self.stop() sont des méthodes que l’on doit créer, self .quit () pré-existe lorsque la fenêtre 
tkinter est créée. 

Nous vous proposons ici une stratégie inspirée du livre de Gérard Swinnen !°. Créons d’abord un attribut d'instance 
self.is_ moving dans le constructeur. Celui-ci va nous servir de « drapeau » pour définir le mouvement du pendule. Il 
contiendra un entier positif ou nul. Lorsque ce drapeau sera égal à O, le pendule sera immobile. Lorsqu'il sera > 0, le pendule 
sera en mouvement. Ainsi : 

— la méthode .start () ajoutera 1 à self.is moving. Si self .is_moving est égal à 1 alors la méthode self .move () 

sera appelée ; 

— la méthode .stop() mettra la valeur de self.is_ moving à 0. 

Puisque .start () ajoute 1 à self.is_moving, le premier clic sur le bouton « Démarrer » appelera la méthode .move () 
car self.is_moving vaudra 1. Si l’utilisateur appuie une deuxième fois sur le bouton « Démarrer », self.is_moving 
vaudra 2 mais n’appellera pas .move () une deuxième fois; cela sera vrai pour tout clic ultérieur de l’utilisateur sur ce bouton. 
Cette astuce évite des appels concurrents de la méthode .move(). 


Le coeur du programme : la méthode .move() 


Il nous reste maintenant à générer la méthode .move() qui meut le pendule. Pour cela vous pouvez vous inspirez de la 
rubrique Un canvas animé dans une classe du chapitre 20 Fenêtres graphiques et Tkinter. 

Cette méthode va réaliser un pas de simulation de £ à t + ôt. Il faudra ainsi réaliser dans l’ordre : 

— Calculer la nouvelle valeur de O (self .theta) au pas t + ôt comme nous l’avons fait précédemment avec la méthode 
semi-implicite d’Euler. 

— Convertir la nouvelle valeur de O (self .theta) en coordonnées cartésiennes dans le repère du pendule (self .x et 
self.y). 

— Convertir ces coordonnées cartésiennes dans le repère du Canvas (self .x_c et self.y_c). 

— Mettre à jour le dessin de la baballe et de la tige avec la méthode self .canv.coords(). 

— Incrémenter le pas de temps. 

— Si le drapeau self.is_moving est supérieur à O, la méthode self .move() est rappelée après 20 millisecondes 
(Conseil : la méthode .after () est votre amie). 


Ressources complémentaires 


Si vous en êtes arrivé là, bravo vous pouvez maintenant admirer votre superbe pendule en mouvement :-) ! 

Voici quelques indications si vous voulez aller un peu plus loin. 

Si vous souhaitez mettre une réglette pour modifier la position de départ du pendule, vous pouvez utiliser la classe 
tk.Scale(). Si vous souhaitez afficher la valeur de O qui se met à jour au fur et à mesure, il faudra instancier un objet 
avec la classe tk. StringVar (). Cet objet devra être passé à l’argument textvariable lors de la création de ce Label avec 
tk. Label (). Ensuite, vous pourrez mettre à jour le texte du Label avec la méthode self .instance_StringVar.set(). 

Pour le fun, si vous souhaitez laisser une « trace » du passage du pendule avec des points colorés, vous pouvez utiliser tout 
simplement la méthode self.canv.create_line() et créer une ligne d’un pixel de hauteur et de largeur pour dessiner un 
point. Pour améliorer l’esthétique, vous pouvez faire en sorte que ces points changent de couleur aléatoirement à chaque arrêt 
/ redémarrage du pendule. 

Si vous souhaitez aller plus loin sur les différentes méthodes numériques de résolution d’équation différentielle associées 
au pendule, nous vous conseillons le site de James Sethna ”” de l’Université de Cornell. 


22.3 Scripts de correction 


Voici les scripts corrigés pour les différents mini-projets. 


Remarque 
— Prenez le temps de chercher par vous-même avant de télécharger les scripts de correction. 


19. https://inforef.be/swi/python.htm 
20. http://pages.physics.cornell.edu/-sethna/StatMech/ComputerExercises/Pendulum/Pendulum.html 
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Nous proposons une correction. D’autres solutions sont possibles. 


Mots anglais dans le protéome humain : words_in_proteome.py 7! 

Genbank2fasta (sans expression régulière) : genbank2fasta_sans_regex.py 2 
Genbank2fasta (avec expressions régulières) : genbank2fasta_avec_regex.py > 
Simulation d’un pendule version simple : tk_pendule.py ** 

Simulation d’un pendule++ (avec réglette et affichage se mettant à jour) : tk_pendule.py 7 


21. 
22. 
23. 
24. 
25. 


https 
https 
https 
https 
https 


://python. 
://python. 
://python. 
://python. 
://python. 


sdv. 
sdv. 
sdv. 
sdv. 
sdv. 


univ-paris-diderot. 
univ-paris-diderot. 


univ-paris-diderot 
univ-paris-diderot 


fr/data-files/words_in_proteome.py 
fr/data-files/genbank2fasta_sans_regex.py 


.fr/data-files/genbank2fasta_avec_regex.py 
.fr/data-files/tk_pendule_simple.py 
univ-paris-diderot. 


fr/data-files/tk_pendule.py 
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Quelques formats de données rencontrés en 
biologie 


A.1 FASTA 


Le format FASTA est utilisé pour stocker une ou plusieurs séquences, d’ ADN, d’ ARN ou de protéines. 
Ces séquences sont classiquement représentées sous la forme : 


>en-téte 

séquence avec un nombre maximum de caractéres par ligne 
séquence avec un nombre maximum de caractéres par ligne 
séquence avec un nombre maximum de caractères par ligne 
séquence avec un nombre maximum de caractères par ligne 
séquence avec un nombre max 


La première ligne débute par le caractère > et contient une description de la séquence. On appelle souvent cette ligne « 
ligne de description » ou « ligne de commentaire ». 

Les lignes suivantes contiennent la séquence à proprement dite, mais avec un nombre maximum fixe de caractères par 
ligne. Ce nombre maximum est généralement fixé à 60, 70 ou 80 caractères. Une séquence de plusieurs centaines de bases ou 
de résidus est donc répartie sur plusieurs lignes. 

Un fichier est dit multifasta lorsqu’il contient plusieurs séquences au format FASTA, les unes à la suite des autres. 

Les fichiers contenant une ou plusieurs séquences au format FASTA portent la plupart du temps l’extension .fasta mais 
on trouve également .seq, .fas, .fna ou .faa. 


A.1.1 Exemples 


La séquence protéique au format FASTA de la sous-unité B de l’hémoglobine humaine !, extraite de la base de données 
UniProt, est : 


>sp|P68871|HBB_HUMAN Hemoglobin subunit beta OS=Homo sapiens OX=9606 GN=HBB PE=1 SV=2 
MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPK 
VKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFG 
KEFTPPVQAAYQKVVAGVANALAHKYH 


La première ligne contient la description de la séquence (Hemoglobin subunit beta), le type de base de données (ici sp 
qui signifie Swiss-Prot), son identifiant (P6887/) et son nom (HBB_HUMAN) dans cette base de données, ainsi que d’autres 
informations (S=Homo sapiens OX=9606 GN=HBB PE=1 SV=2). 

Les lignes suivantes contiennent la séquence sur des lignes ne dépassant pas, ici, 60 caractéres. La séquence de la sous- 
unité B de l’hémoglobine humaine est composée de 147 acides aminés, soit deux lignes de 60 caractères et une troisième de 
27 caractères. 


Définition 
UniProt? est une base de données de séquences de protéines. Ces séquences proviennent elles-mêmes de deux autres 
bases de données : Swiss-Prot (où les séquences sont annotées manuellement) et TTEMBL (où les séquences sont annotées 


1. https://www.uniprot.org/uniprot/P68871 
2. https://www.uniprot.org/ 
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automatiquement). 


Voici maintenant la séquence nucléique (ARN), au format FASTA, de l’insuline humaine 3 extraite de la base de données 
GenBank* : 


>BT006808.1 Homo sapiens insulin mRNA, complete cds 
ATGGCCCTGTGGATGCGCCTCCTGCCCCTGCTGGCGCTGCTGGCCCTCTGGGGACCTGACCCAGCCGCAG 
CCTTTGTGAACCAACACCTGTGCGGCTCACACCTGGTGGAAGCTCTCTACCTAGTGTGCGGGGAACGAGG 
CTTCTTCTACACACCCAAGACCCGCCGGGAGGCAGAGGACCTGCAGGTGGGGCAGGTGGAGCTGGGCGGG 
GGCCCTGGTGCAGGCAGCCTGCAGCCCTTGGCCCTGGAGGGGTCCCTGCAGAAGCGTGGCATTGTGGAAC 
AATGCTGTACCAGCATCTGCTCCCTCTACCAGCTGGAGAACTACTGCAACTAG 


On retrouve sur la première ligne la description de la séquence (Homo sapiens insulin mRNA), ainsi que son identifiant 
(BT006808.1) dans la base de données GenBank. 

Les lignes suivantes contiennent les 333 bases de la séquence, réparties sur cinq lignes de 70 caractéres maximum. II est 
curieux de trouver la base T (thymine) dans une séquence d'ARN qui ne devrait contenir normalement que les bases A, U, G 
et C. Ici, la représentation d’une séquence d’ ARN avec les bases de 1? ADN est une convention. 

Pour terminer, voici trois séquences protéiques, au format FASTA, qui correspondent à l’insuline chez humaine (Homo 
sapiens), féline (Felis catus) et bovine (Bos taurus) : 


>sp|P01308|INS_HUMAN Insulin OS=Homo sapiens OX=9606 GN=INS PE=1 SV=1 
MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRREAED 
LOVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN 
>sp|P06306|INS_FELCA Insulin OS=Felis catus OX=9685 GN=INS PE=1 SV=2 
MAPWTRLLPLLALLSLWIPAPTRAFVNQHLCGSHLVEALYLVCGERGFFYTPKARREAED 
LQGKDAELGEAPGAGGLQPSALEAPLQKRGIVEQCCASVCSLYQLEHYCN 
>sp|P01317|INS_BOVIN Insulin OS=Bos taurus 0X=9913 GN=INS PE=1 SV=2 
MALWTRLRPLLALLALWPPPPARAFVNQHLCGSHLVEALYLVCGERGFFYTPKARREVEG 
PQVGALELAGGPGAGGLEGPPQKRGIVEQCCASVCSLYQLENYCN 


Ces séquences proviennent de la base de données UniProt et sont téléchargeables en suivant ce lien?. 


Chaque séquence est délimitée par la ligne d’en-téte qui débute par >. 


A.1.2 Manipulation avec Python 


A partir de l’exemple précédent des 3 séquences d’insuline, voici un exemple de code qui lit un fichier FASTA avec 


Python : 
prot_dict = {} 
with open("insulin.fasta", "r") as fasta_file: 
prot_id = "" 


for line in fasta_file: 
if line.startswith(">"): 
prot_id = line[i:].split() [0] 
prot_dict[prot_id] = "" 
else: 
prot_dict[prot_id] += line.strip() 
for id in prot_dict: 
print (id) 
print (prot_dict [id] [:30]) 


Pour chaque séquence lue dans le fichier FASTA, on affiche son identifiant et son nom puis les 30 premiers résidus de sa 
séquence : 

sp|P06306|INS_FELCA 

MAPWTRLLPLLALLSLWIPAPTRAFVNQHL 

sp|P01317|INS_BOVIN 

MALWTRLRPLLALLALWPPPPARAFVNQHL 


sp|P01308|INS_HUMAN 
MALWMRLLPLLALLALWGPDPAAAFVNQHL 


Notez que les protéines sont stockées dans un dictionnaire (prot _dict) où les clefs sont les identifiants et les valeurs les 
séquences. 
On peut faire la méme chose avec le module Biopython : 


3. https://www.ncbi.nlm.nih.gov/nuccore/BT006808.1?report=fasta 

4. https://www.ncbi.nlm.nih. gov/nuccore/AY899304. 1?report=genbank 

5. https: //www.uniprot.org/uniprot/?sort=scorekdesc=&compress=no&query=id : P01308/%200R/%20id:P01317/%200R/20id: 
P06306&f ormat=fasta 
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from Bio import SeqI0 
with open("insulin.fasta", "r") as fasta_file: 
for record in SeqI0.parse(fasta_file, "fasta"): 
print (record.id) 
print (str(record.seq) [:30]) 


Cela produit le même résultat. L’ utilisation de Biopython rend le code plus compacte car on utilise ici la fonction SeqI0. parse () 


qui s’occupe de lire le fichier FASTA. 


A2 GenBank 


GenBank est une banque de séquences nucléiques. Le format de fichier associé contient l’information nécessaire pour 
décrire un gène ou une portion d’un génome. Les fichiers GenBank porte le plus souvent l’extension . gbk. 

Le format GenBank est décrit de manière très complète sur le site du NCBI °. En voici néanmoins les principaux éléments 
avec l’exemple du gène qui code pour la trypsine ’ chez l'Homme. 


A.2.1 L'en-téte 


LOCUS HUMTRPSGNA 800 bp mRNA linear PRI 14-JAN-1995 
DEFINITION Human pancreatic trypsin 1 (TRY1) mRNA, complete cds. 
ACCESSION M22612 


VERSION M22612.1 
KEYWORDS trypsinogen. 
SOURCE Homo sapiens (human) 


ORGANISM Homo sapiens 
Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini; 
Catarrhini; Hominidae; Homo. 


besad 


Ligne 1 (LOCUS) : le nom du locus (HUMTRPSGNA), la taille du gène (800 paires de base), le type de molécule (ARN 
messager). 

Ligne 3 (ACCESSION) : l'identifiant de la séquence (M22612). 

Ligne 4 (VERSION) : la version de la séquence (M22612.1). Le nombre qui est séparé de l’identifiant de la séquence par 
un point est incrémenté pour chaque nouvelle version de la fiche GenBank. Ici ./ indique que nous en sommes à la première 
version. 

Ligne 6 (SOURCE) : la provenance de la séquence. Souvent |’ organisme d’origine. 

Ligne 7 (ORGANISME) : le nom scientifique de l’organisme, suivi de sa taxonomie (lignes 8 à 10). 


A.2.2 Les features 


Les 
FEATURES Location/Qualifiers 
source 1..800 
/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/map="7q32-qter" 
/tissue_type="pancreas" 
gene 1..800 
/gene="TRY1" 
CDS 7.750 


/gene="TRY1" 
/codon_start=1 
/product="trypsinogen" 
/protein_id="AAA61231.1" 
/db_xref="GDB:G00-119-620" 
/translation="MNPLLILTFVAAALAAPFDDDDKIVGGYNCEENSVPYQVSLNSG 
YHFCGGSLINEQWVVSAGHCYKSRIQVRLGEHNIEVLEGNEQFINAAKIIRHPQYDRK 
TLNNDIMLIKLSSRAVINARVSTISLPTAPPATGTKCLISGWGNTASSGADYPDELQC 
LDAPVLSQAKCEASYPGKITSNMFCVGFLEGGKDSCQGDSGGPVVCNGQLQGVVSWGD 
GCAQKNKPGVYTKVYNYVKWIKNTIAANS" 
sig_peptide Tesbit 

/gene="TRY1" 
/note="G00-119-620" 

Lis] 


6. https://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html 
7. https://www.ncbi.nlm.nih.gov/nuccore/M22612.1 
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Ligne 9 (gene 


Ligne 22 (sig_peptide 


A.2.3 La séquence 


F4 
ORIGIN 
61 
121 
181 
241 
301 
361 
421 
481 
541 
601 
661 
721 
781 


// 


accaccatga 
gatgatgatg 
gtgtccctga 
gtatcagcag 
gaagtcctgg 
tacgacagga 
atcaacgccc 
tgcctcatct 
cagtgcctgg 
attaccagca 
gattctggtg 
ggctgtgcce 
attaagaaca 
aataaagtga 


1..800) : la délimitation du gène. Ici de la base 1 à la base 800. Par ailleurs, la notation 
<x. . y indique que la séquence est partielle sur l’extrémité 5”. Réciproquement, x. . y> indique que la séquence est partielle 
sur l’extrémité 3”. Enfin, pour les séquences d' ADN, la notation complement (x. .y) indique que le gène se trouve de la base 
x à la base y, mais sur le brin complémentaire. 
Ligne 10 (/gene="TRY1") : le nom du gène. 
Ligne 11 (CDS 
Ligne 14 (/product="trypsinogen") : le nom de la protéine produite. 
Ligne 17 à 20 (/translation="MNPLLIL. . .): la séquence protéique issue de la traduction de la séquence codante. 
7..51): la délimitation du peptide signal. 


7..750) : la délimitation de la séquence codante. 


atccactcct 
acaagatcgt 
attctggcta 
gccactgcta 
aggggaatga 
agactctgaa 
gcgtgtccac 
ctggctg888 
atgctcctgt 
acatgttctg 
gccctgtggt 
agaagaacaa 
ccatagctge 
ccctgttctc 


gatccttacc 
tgggggctac 
ccacttctgt 
caagtcccgc 
gcagttcatc 
caatgacatc 
catctctctg 
caacactgcg 
gctgagccag 
tgtgggcttc 
ctgcaatgga 
gcctggagtc 
caatagctaa 


tttgtggcag 
aactgtgagg 
ggtggctccc 
atccaggtga 
aatgcagcca 
atgttaatca 
cccaccgccc 
agctctggcg 
gctaagtgtg 
cttgagg8a8 
cagctccaag 
tacaccaagg 
agcccccagt 


ctgctcttge 
agaattctgt 
tcatcaacga 
gactgggaga 
agatcatccg 
agctctcctc 
ctccagccac 
ccgactaccc 
aagcctccta 
gcaaggattc 
gagttgtctc 
tctacaacta 
atctcttcag 


La séquence est contenue entre les balises ORIGIN (ligne 2) et // (ligne 17). 
Chaque ligne est composée d’une série d’espaces, puis du numéro du premier nucléotide de la ligne, puis d’au plus 6 blocs 


de 10 nucléotides. Chaque bloc est précédé d’un espace. 
Par exemple, ligne 10, le premier nucléotide de la ligne (t) est le numéro 421 dans la séquence. 


A.2.4 Manipulation avec Python 


À partir de l’exemple précédent, voici comment lire un fichier GenBank avec Python et le module Biopython : 


from Bio import SeqI0 
with open("M22612.gbk", 


record = SeqI0.read(gbk_file, 


print (record.id) 
print (record. description) 
print (record.seq[:60]) 


nr") as 


gbk_file: 


"genbank") 


tgeccccttt 
cccctaccag 
acagtgggtg 
gcacaacatc 
ccacccccaa 
acgtgcagta 
tggcacgaag 
agacgagctg 
ccctggaaag 
atgtcagggt 
ctggggtgat 
cgtgaaatgg 
tctctatacc 


Pour la séquence lue dans le fichier GenBank, on affiche son identifiant, sa description et les 60 premiers résidus : 


M22612.1 


Human pancreatic trypsin 1 (TRY1) mRNA, 


complete cds. 


ACCACCATGAATCCACTCCTGATCCTTACCTTTGTGGCAGCTGCTCTTGCTGCCCCCTTT 


Il est également possible de lire un fichier GenBank sans le module Biopython. Une activité dédiée est proposée dans le 
chapitre 22 Mini-projets. 


A.3 PDB 


La Protein Data Bankë (PDB) est une banque de données qui contient les structures de biomacromolécules (protéines, 
ADN, ARN, virus. ..). Historiquement, le format de fichier qui y est associé est le PDB, dont une documentation détaillée est 
disponible sur le site éponyme °. Les principales extensions de fichier pour ce format de données sont . ent et surtout . pdb. 

Un fichier PDB est constitué de deux parties principales : l’en-tête et les coordonnées. L’en-téte est lisible et utilisable 
par un être humain (et aussi par une machine). A l'inverse les coordonnées sont surtout utilisables par un programme pour 
calculer certaines propriétés de la structure ou simplement la représenter sur l’écran d’un ordinateur. Bien sûr, un utilisateur 
expérimenté peut parfaitement jeter un œil à cette seconde partie. 


Examinons ces deux parties avec la trypsine bovine 


8. https://www.rcsb.org/ 
9. http://www.wwpdb.org/documentation/file-format-content/format33/v3.3.html 


10. https://wuww.rcsb.org/structure/2PTN 
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A.3.1 En-tête 


Pour la trypsine bovine, l’en-tête compte 510 lignes. En voici quelques unes : 


HEADER HYDROLASE (SERINE PROTEINASE) 26-OCT-81 2PTN 

TITLE ON THE DISORDERED ACTIVATION DOMAIN IN TRYPSINOGEN. 

TITLE 2 CHEMICAL LABELLING AND LOW-TEMPERATURE CRYSTALLOGRAPHY 

COMPND MOL_ID: 1; 

COMPND 2 MOLECULE: TRYPSIN; 

COMPND 3 CHAIN: A; 

EER 

SOURCE 2 ORGANISM_SCIENTIFIC: BOS TAURUS; 

Fe 

EXPDTA X-RAY DIFFRACTION 

[owed 

REMARK 2 RESOLUTION. 1.55 ANGSTROMS. 

[...] 

DBREF 2PTN A 16 245 UNP P00760 TRY1_BOVIN 21 243 

SEQRES 1 A 223 ILE VAL GLY GLY TYR THR CYS GLY ALA ASN THR VAL PRO 
SEQRES 2 À 223 TYR GLN VAL SER LEU ASN SER GLY TYR HIS PHE CYS GLY 
SEQRES 3 A 223 GLY SER LEU ILE ASN SER GLN TRP VAL VAL SER ALA ALA 
SEQRES 4 A 223 HIS CYS TYR LYS SER GLY ILE GLN VAL ARG LEU GLY GLU 

Es 

HELIX 1 Hi SER A 164 ILE A 176 1SNGL ALPHA TURN,REST IRREG. 13 
HELIX 2 H2 LYS A 230 VAL A 235 5CONTIGUOUS WITH H3 6 
HELIX 3 H3 SER A 236 ASN A 245 1CONTIGUOUS WITH H2 10 
SHEET 1 A 7 TYR A 20 THR A 21 O 

SHEET 2 A 7 LYS A 156 PRO A 161 -1 N CYS A 157 O TYR A 20 

[eee 

SSBOND 1 CYS A 22 CYS A 157 1555 1555 2.04 
SSBOND 2 CYS A 42 CYS A 58 1555 1555 2.02 
[sand 


Ligne 1. Cette ligne HEADER contient le nom de la protéine (HYDROLASE (SERINE PROTEINASE)), la date de dépôt de 
cette structure dans la banque de données (26 octobre 1981) et l’identifiant de la structure dans la PDB, on parle souvent de « 
code PDB » (2PTN). 

Ligne 2. TITLE correspond au titre de l’article scientifique dans lequel a été publié cette structure. 

Lignes 4-6. COMPND indique que la trypsine est composée d’une seule chaine peptidique, appelée ici A. 

Ligne 8. SOURCE indique le nom scientifique de l’organisme dont provient cette protéine (ici, le bœuf). 

Ligne 10. EXPDTA précise la technique expérimentale employée pour déterminer cette structure. Ici, la cristallographie 
aux rayons X. Mais on peut également trouver SOLUTION NMR pour de la résonance magnétique nucléaire en solution, 
ELECTRON MICROSCOPY pour de la microscopie électronique... 

Ligne 12. REMARK 2 précise, dans le cas d’une détermination par cristallographie aux rayons X, la résolution obtenue, 
ici 1,55 Angstréms. 

Ligne 14. DBREF indique les liens éventuels vers d’autres banques de données. Ici, l’identifiant correspondant à cette 
protéine dans UniProt (UNP) est P00760 !!. 

Ligne 15-18. SEQRES donnent à la séquence de la protéine. Les résidus sont représentés par leur code à 3 lettres. 

Lignes 20-22 et 23-24. HELIX et SHEET correspondent aux structures secondaires hélices œ et brin B de cette protéine. 
Ici, HI SER A 164 ILE A 176 indique qu'il y a une première hélice œ (HI) comprise entre les résidus Ser164 et Ile176 de la 
chaine A. 

Lignes 26-27. SSBOND indique les bonds disulfures. Ici, entre les résidus Cys22 et Cys157 et entre les résidus Cys42 et 
Cys58. 


A.3.2 Coordonnées 


Avec la même protéine, la partie coordonnées représente plus de 1700 lignes. En voici quelques unes correspondantes au 
résidu leucine 99 : 


[...] 
ATOM 601 N LEU 


A 99 10.007 19.687 17.536 1.00 12.25 N 
ATOM 602 CA LEU A 99 9.599 18.429 18.188 1.00 12.25 Cc 
ATOM 603 C LEU A 99 10.565 17.281 17.914 1.00 12.25 C 
ATOM 604 0 LEU A 99 10.256 16.101 18.215 1.00 12.25 0 
ATOM 605 CB LEU A 99 8.149 18.040 17.853 1.00 12.25 (0 
ATOM 606 CG LEU A 99 7.125 19.029 18.438 1.00 18.18 C 
ATOM 607 CDi LEU A 99 5.695 18.554 18.168 1.00 18.18 Cc 
ATOM 608 CD2 LEU A 99 7.323 19.236 19.952 1.00 18.18 C 
Le] 


11. https://www.uniprot.org/uniprot/P00760 
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FIGURE A.1 — Structure tridimensionnelle d’un résidu leucine. Les noms des atomes sont indiqués en noir. 


Chaque ligne correspond à un atome et débute par ATOM ou HETATM. ATOM désigne un atome de la structure de la biomo- 

lécule. HETATM est utilisé pour les atomes qui ne sont pas une biomolécule, comme les ions ou les molécules d’eau. 

Toutes les lignes de coordonnées ont sensiblement le même format. Par exemple, pour la première ligne : 

— ATOM (ou HETATM). 

— 601 : le numéro de l’atome. 

— N: le nom de l’atome. Ici, un atome d’azote du squelette peptidique. La structure complète du résidu leucine est 
représentée figure A.1. 

— LEU: le résidu dont fait partie l’atome. Ici une leucine. 

— A: le nom de la chaîne peptidique. 

— 99 : le numéro du résidu dans la protéine. 

— 10.007 : la coordonnées x de l’atome. 

— 19.687 : la coordonnées y de l’atome. 

— 17.536 : la coordonnées z de l’atome. 

— 1.00: le facteur d’ occupation, c’est-à-dire la probabilité de trouver l’atome à cette position dans l’espace en moyenne. 
Cette probabilité est inférieure à 1 lorsque, expérimentalement, on n’a pas pu déterminer avec une totale certitude la 
position de l’atome. Par exemple dans le cas d’un atome très mobile dans une structure, qui est déterminé comme étant 
à deux positions possibles, chaque position aura alors la probabilité 0,50. 

— 12.25: le facteur de température qui est proportionnel à la mobilité de l’atome dans l’espace. Les atomes situés en 
périphérie d’une structure sont souvent plus mobiles que ceux situés au coeur de la structure. 

— N:l’élément chimique de l’atome. Ici, l’azote. 

Une documentation plus complète des différents champs qui constituent une ligne de coordonnées atomiques se trouve sur 

le site de la PDB ?”. 

Les résidus sont ensuite décrits les uns après les autres, atome par atome. Voici par exemple les premiers résidus de la 

trypsine bovine : 


[...] 
ATOM 


1 N ILE A 16 -8.155 9.648 20.365 1.00 10.68 N 
ATOM 2 CA ILE A 16 -8.150 8.766 19.179 1.00 10.68 C 
ATOM 3 C ILE A 16 -9.405 9.018 18.348 1.00 10.68 Cc 
ATOM 4 0 ILE A 16 -10.533 8.888 18.870 1.00 10.68 0 
ATOM 5 CB ILE A 16 -8.091 7.261 19.602 1.00 10.68 Cc 
ATOM 6 CGi ILE A 16 -6.898 6.882 20.508 1.00 7.42 C 
ATOM 7 CG2 ILE A 16 -8.178 6.281 18.408 1.00 7.42 C 
ATOM 8 CDi ILE A 16 -5.555 6.893 19.773 1.00 7.42 C 
ATOM 9 N VAL A 17 -9.224 9.305 17.090 1.00 9.63 N 
ATOM 10 CA VAL A 17 -10.351 9.448 16.157 1.00 9.63 C 
ATOM 11 C VAL A 17 -10.500 8.184 15.315 1.00 9.63 C 
ATOM 12 0 VAL A 17 -9.496 7.688 14.748 1.00 9.63 0 
ATOM 13 CB VAL A 17 -10.123 10.665 15.222 1.00 9.63 C 
ATOM 14 CG1 VAL A 17 -11.319 10.915 14.278 1.00 11.95 C 
ATOM 15 CG2 VAL A 17 -9.737 11.970 15.970 1.00 11.95 C 
Petal 


12. http: //www.wwpdb. org/documentation/file-format-content/format33/sect9.html 
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Vous remarquez que le numéro du premier résidu est 16 et non pas 1. Cela s’explique par la technique expérimentale 
utilisée qui n’a pas permis de déterminer la structure des 15 premiers résidus. 

La structure de la trypsine bovine n’est constituée que d’une seule chaîne peptidique (notée A). Lorsqu'une structure est 
composée de plusieurs chaînes, comme dans le cas de la structure du récepteur GABAB | et 2 chez la drosophile (code PDB 
5X9X ©) : 


[...] 


ATOM 762 HB1 ALA A 44 37.162 -2.955 2.220 1.00 0.00 H 

ATOM 763 HB2 ALA A 44 38.306 -2.353 3.417 1.00 0.00 H 

ATOM 764 HB3 ALA À 44 38.243 -1.621 1.814 1.00 0.00 H 

TER 765 ALA A 44 

ATOM 766 N GLY B 95 -18.564 3.009 13.772 1.00 0.00 N 

ATOM 767 CA GLY B 95 -19.166 3.646 12.621 1.00 0.00 c 

ATOM 768 C GLY B 95 -20.207 2.755 11.976 1.00 0.00 c 

Estad 

La premiére chaíne est notée A et la seconde B. La séparation entre les deux est marquée par la ligne TER 765 
ALA A 44. 


Dans un fichier PDB, chaque structure porte un nom de chaîne différent. 

Enfin, lorsque la structure est déterminée par RMN, il est possible que plusieurs structures soient présentes dans le méme 
fichier PDB. Toutes ces structures, ou « modèles », sont des solutions possibles du jeu de contraintes mesurées expérimenta- 
lement en RMN. Voici un exemple, toujours pour la structure du récepteur GABAB 1 et 2 chez la drosophile : 


Esa] 

MODEL 1 

ATOM 1 N MET A 1 -27.283 -9.772 5.388 1.00 0.00 N 
ATOM 2 CA MET A 1 -28.233 -8.680 5.682 1.00 0.00 C 
F1 

ATOM 1499 HG2 GLU B 139 36.113 -5.242 2.536 1.00 0.00 H 
ATOM 1500 HG3 GLU B 139 37.475 -4.132 2.428 1.00 0.00 H 
TER 1501 GLU B 139 

ENDMDL 

MODEL 2 

ATOM 1 N MET A 1 -29.736 -10.759 4.394 1.00 0.00 N 
ATOM 2 CA MET A 1 -28.372 -10.225 4.603 1.00 0.00 Cc 
Mirad 

ATOM 1499 HG2 GLU B 139 36.113 -5.242 2.536 1.00 0.00 H 
ATOM 1500 HG3 GLU B 139 37.475 -4.132 2.428 1.00 0.00 H 
TER 1501 GLU B 139 

ENDMDL 

MODEL 2 

ATOM 1 N MET A 1 -29.736 -10.759 4.394 1.00 0.00 N 
ATOM 2 CA MET A 1 -28.372 -10.225 4.603 1.00 0.00 Cc 
ee 


Chaque structure est encadrée par les lignes 
MODEL n 


et 
ENDMDL 


où n est le numéro du modèle. Pour la structure du récepteur GABAB | et 2, il y a 20 modèles de décrits dans le fichier 
PDB. 


A.3.3 Manipulation avec Python 


Le module Biopython peut également lire un fichier PDB. 
Chargement de la structure de la trypsine bovine : 


from Bio.PDB import PDBParser 


parser = PDBParser () 

prot_id = "2PTN" 

prot_file = "2PTN.pdb" 

structure = parser.get_structure(prot_id, prot_file) 
Remarque 


Les fichiers PDB sont parfois (très) mal formatés. Si Biopython ne parvient pas à lire un tel fichier, remplacez alors la 2e 
ligne par parser = PDBParser (PERMISSIVE=1). Soyez néanmoins très prudent quant aux résultats obtenus. 


13. http: //www.rcsb.org/structure/5X9X 
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Affichage du nom de la structure et de la technique expérimentale utilisée pour déterminer la structure : 


print (structure.header ["head"]) 
print (structure.header ["structure_method"]) 


ce qui produit : 
hydrolase (serine proteinase) 
x-ray diffraction 
Extraction des coordonnées de l’atome N du résidu Ile 16 et de l’atome CA du résidu Val17 : 


model = structure [0] 

chain = model ["A"] 

resi = chain[16] 

res2 = chain[17] 

print(resi.resname, resi["N"].coord) 
print (res2.resname, res2["CA"].coord) 


ce qui produit : 
ILE [ -8.15499973 9.64799976 20.36499977] 
VAL [-10.35099983 9.44799995 16.15699959] 


L'objet resi ["N"] . coord est un array de NumPy (voir le chapitre 17 Quelques modules d’intérét en bioinformatique). 
On peut alors obtenir simplement les coordonnées x, y et z d’un atome : 


print(resi["N"].coord[0], resi["N"].coord[1], resi["N"].coord[2]) 


ce qui produit : 
-8.155 9.648 20.365 


Remarque 
Biopython utilise la hiérarchie suivante : 

structure > model > chain > residue > atom 

même lorsque la structure ne contient qu’un seul modèle. C’est d’ailleurs le cas ici, puisque la structure a été obtenue par 

cristallographie aux rayons X. 


Enfin, pour afficher les coordonnées des carbones œ (notés CA) des 10 premiers résidus (à partir du résidu 16 car c’est le 
premier résidu dont on connaît la structure) : 


res_start = 16 
model = structure [0] 
chain = model["A"] 
for i in range(10): 
idx = res_start + i 
print (chain[idx].resname, idx, chain[idx]["CA"].coord) 


avec pour résultat : 


.76599979 19.17900085] 
.44799995 16.15699959] 
-63000011 14.25899982] 
.89899993 16.68400002] 


ILE 16 [ -8.14999962 
VAL 17 [-10.35099983 
GLY 18 [-12.02099991 
GLY 19 [-10.90200043 
TYR 20 [-12.65100002 .44200003 19.01600075] 
THR 21 [-13.01799965 .93800002 22.76000023] 
CYS 22 [-10.02000046 -1.16299999 23.76000023] 
GLY 23 [-11.68299961 -2.86500001 26.7140007 ] 
ALA 24 [-10.64799976 -2.62700009 30.36100006] 
ASN 25 [ -6.96999979 -3.43700004 31.02000046] 


© R & O © © 


Il est aussi très intéressant (et formateur) d’écrire son propre parser de fichier PDB, c’est-à-dire un programme qui lit un 
fichier PDB (sans le module Biopython). Dans ce cas, la figure A.2 vous aidera à déterminer comment extraire les différentes 
informations d’une ligne de coordonnées ATOM ou HETATM. 

Exemple : pour extraire le nom du résidu, il faut isoler le contenu des colonnes 18 à 20 du fichier PDB, ce qui correspond 
aux index de 17 à 19 pour une chaîne de caractères en Python, soit la tranche de chaîne de caractères [17:20] car la première 
borne est incluse et la seconde exclue. 

Pour lire le fichier PDB de la trypsine bovine (2PTN.pdb) et extraire (encore) les coordonnées des carbones œ des 10 
premiers résidus, nous pouvons utiliser le code suivant : 
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FIGURE A.2 — Format PDB et les différents champs de coordonnées. 
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with open("2PTN.pdb", "r") as pdb_file: 
res_count = 0 
for line in pdb_file: 
if line.startswith("ATOM"): 
atom_name = line [12:16].strip() 
res_name = line[17:20].strip() 
res_num = int(line [22:26] ) 
if atom_name == "CA": 
res_count += 1 
x = float (line [30:38]) 
y = float (line [38:46]) 
z = float(line [46:54]) 
print(res_name, res_num, x, y, Z) 
if res_count >= 
break 


ce qui donne : 


ILE 16 -8.15 8.766 19.179 
VAL 17 -10.351 9.448 16.157 
GLY 18 -12.021 6.63 14.259 
GLY 19 -10.902 3.899 16.684 
TYR 20 -12.651 1.442 19.016 
THR 21 -13.018 0.938 22.76 
CYS 22 -10.02 -1.163 23.76 
GLY 23 -11.683 -2.865 26.714 
ALA 24 -10.648 -2.627 30.361 
ASN 25 -6.97 -3.437 31.02 


Remarque 
Pour extraire des valeurs numériques, comme des numéros de résidus ou des coordonnées atomiques, il ne faudra pas 
oublier de les convertir en entiers ou en floats. 


A.4 Format XML, CSV et TSV 


Les formats XML, CSV et TSV dont des formats de fichiers très largement utilisés en informatique. Ils sont tout autant 
trés utilisés en biologie. En voici quelques exemples. 


A4.1 XML 


Le format XML est un format de fichier qui permet de stocker quasiment n'importe quel type d’information de façon 
structurée et hiérarchisée. L’acronyme XML signifie Extensible Markup Language qui pourrait se traduire en français par « 
Langage de balisage extensible '* ». Les balises dont il est question servent à délimiter du contenu : 

<balise>contenu</balise> 

La balise <balise> est une balise ouvrante. La balise </balise> est une balise fermante. Notez le caractère / qui marque 
la différence entre une balise ouvrante et une balise fermante. 

Il existe également des balises vides, qui sont à la fois ouvrantes et fermantes : 

<balise /> 

Une balise peut avoir certaines propriétés, appelées attributs, qui sont définies, dans la balise ouvrante. Par exemple : 

<balise propriétél=valeurl propriété2=valeur2>contenu</balise> 

Un attribut est un couple nom et valeur (par exemple propriété1 est un nom et valeur1 est la valeur associée). 

Enfin, les balises peuvent étre imbriquées les unes dans les autres : 


<protein> 
<element>élément 1</element> 
<element>élément 2</element> 
<element>élément 3</element> 
</protein> 


Dans cet exemple, nous avons trois balises element qui sont contenues dans une balise protein. 
Voici un autre exemple avec l’enzyme trypsine ! humaine (code P07477 !°) telle qu’on peut la trouver décrite dans la base 
de données UniProt : 


14. https://fr.wikipedia. org/wiki/Extensible_Markup_Language 
15. https: //www.uniprot.org/uniprot/P07477 
16. https: //www.uniprot.org/uniprot/P07477.xml 
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<?xml version='1.0' encoding='UTF-8'?> 

<uniprot xmlns="http://uniprot.org/uniprot" xmlns:xsi=[...]> 

<entry dataset="Swiss-Prot" created="1988-04-01" modified="2018-09-12" [...]> 
<accession>P07477</accession> 

<accession>A1A509</accession> 

<accession>A6NJ71</accession> 


[...] 

<gene> 

<name type="primary">PRSS1</name> 

<name type="synonym">TRP1</name> 

<name type="synonym">TRY1</name> 

<name type="synonym">TRYP1 </name > 

</gene> 

[...] 

<sequence length="247" mass="26558" checksum="DD49A487B8062813" [...]> 
MNPLLILTFVAAALAAPFDDDDKIVGGYNCEENSVPYQVSLNSGYHFCGGSLINEQWVVS 
AGHCYKSRIQVRLGEHNIEVLEGNEQF INAAKIIRHPQYDRKTLNNDIMLIKLSSRAVIN 
ARVSTISLPTAPPATGTKCLISGWGNTASSGADYPDELQCLDAPVLSQAKCEASYPGKIT 
SNMFCVGFLEGGKDSCQGDSGGPVVCNGQLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIK 
NTIAANS 


</sequence> 
</entry> 
Ed 


</uniprot> 


La ligne 1 indique que nous avons bien un fichier au format XML. 
La ligne 3 indique que nous avons une entrée UniProt. Il s’afit d’une balise ouvrante avec plusieurs attributs (dataset="Swiss-Prot", 
created="1988-04-01"...). 
Les lignes 4-6 précisent les numéros d’accession dans la base de données UniProt qui font référence à cette même protéine. 
Les lignes 8-13 listent les quatre gènes correspondants à cette protéine. Le premier gène porte l’attribut type="primary" 
et indique qu'il s’agit du nom officiel du gène de la trypsine. L’attribut type="synonym" pour les autres gènes indique qu'il 
s’agit bien de noms synonymes pour le gène PRSS1. 
Les lignes 15-21 contiennent la séquence de la trypsine. Dans les attributs de la balise <sequence>, on retrouve, par 
exemple, la taille de la protéine (1ength="247"). 
Voici un exemple de code Python pour manipuler le fichier XML de la trypsine humaine : 


from lxml import etree 
import re 


with open("P07477.xm1") as xml_file: 


xml_content = xml_file.read() 
xml_content = re.sub("<uniprot [7>]+>", "<uniprot>", xml_content) 
root = etree.fromstring(xml_ content .encode ("utf-8")) 


for gene in root.xpath("/uniprot/entry/gene/name"): 
print(f"gene : {gene.text} ({gene.get('type')})") 


sequence = root.xpath("/uniprot/entry/sequence") [0] 
print(f"sequence: {sequence.text.strip()}") 
print(f"length: {sequence.get('length')}") 


Ligne 1. On utilise le sous-module etree du module /xml pour lire le fichier XML. 
Ligne 2. On utilise le module d’expressions réguliéres re pour supprimer tous les attributs de la balise uniprot (ligne 7). 
Nous ne rentrerons pas dans les détails, mais ces attributs rendent plus complexe la lecture du fichier XML. 
Ligne 9. La variable root contient le fichier XML prét a étre manipulé. 
Ligne 11. On recherche les noms des gènes (balises <name></name>) associés à la trypsine. Pour cela, on utilise la 
méthode .xpath() avec comme argument l’enchaînement des différentes balises qui conduisent aux noms des gènes. 
Ligne 12. Pour chaque nom de gène, on va afficher son contenu (gene. text) et la valeur associée à l’attribut type avec 
la méthode . get ("type"). 
Ligne 11. On stocke dans la variable sequence la balise associée à la séquence de la protéine. Comme root .xpath("/uniprot/entry, 
renvoie un itérateur et qu’il n’y a qu’une seule balise séquence, on prend ici le seul et unique élément root.xpath("/uniprot/entry/sequ 
Ligne 15. On affiche le contenu de la séquence sequence. text, nettoyé d’éventuels retours chariots ou espaces sequence.text.strip 
Ligne 16. On affiche la taille de la séquence en récupérant la valeur de l’attribut Length (toujours de la balise <sequence></sequence>) 
Le résultat obtenu est le suivant : 


gene : PRSS1 (primary) 
gene : TRP1 (synonym) 
gene : TRY1 (synonym) 
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gene 


sequence: 


TRYP1 (synonym) 


AGHCYKSRIQVRLGEHNIEVLEGNEQFINAAKIIRHPQYDRKTLNNDIMLIKLSSRAVIN 
ARVSTISLPTAPPATGTKCLISGWGNTASSGADYPDELQCLDAPVLSQAKCEASYPGKIT 
SNMFCVGFLEGGKDSCQGDSGGPVVCNGQLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIK 
NTIAANS 

length: 247 


A.4.2 CSV et TSV 


Définition des formats 


MNPLLILTFVAAALAAPFDDDDKIVGGYNCEENSVPYQVSLNSGYHFCGGSLINEQWVVS 


L’acronyme CSV signifie « Comma-Separated values » qu’on peut traduire littéralement par « valeurs séparées par des 
virgules ». De façon similaire, TSV signifie « Tabulation-Separated Values », soit des « valeurs séparées par des tabulations ». 

Ces deux formats sont utiles pour stocker des données structurées sous forme de tableau, comme vous pourriez |’ avoir 
dans un tableur. 

À titre d’exemple, le tableau ci-dessous liste les structures associées à la transferrine, protéine présente dans le plasma 
sanguin et impliquée dans la régulation du fer. Ces données proviennent de la Protein Data Bank (PDB). Pour chaque protéine 
(PDB ID), est indiqué le nom de l’organisme associé (Source), la date à laquelle cette structure a été déposée dans la PDB 
(Deposit Date), le nombre d’acides aminés de la protéine et sa masse moléculaire (MW). 


PDB ID 


Source 


Deposit Date 


1A8E 
1A8F 
1AIV 
1AOV 
1B3E 
1D3K 
1D4N 
1DOT 


[...] 


Homo sapiens 
Homo sapiens 
Gallus gallus 

Anas platyrhynchos 
Homo sapiens 
Homo sapiens 
Homo sapiens 
Anas platyrhynchos 
[...] 


Voici maintenant l'équivalent en CSV 1” : 


PDB ID,Source,Deposit Date,Length ,MW 

1A8E,Homo sapiens ,1998-03-24 ,329 ,36408.40 
1A8F ,Homo sapiens ,1998-03-25 ,329 ,36408.40 
1AIV,Gallus gallus ,1997-04-28 ,686 ,75929.00 
,»Anas platyrhynchos ,1996-12-11,686,75731.80 
Homo sapiens ,1998-12-09,330,36505.50 
Homo sapiens ,1999-09-29 ,329 ,36407.40 
,Homo sapiens ,1999-10-04,329 ,36399.40 
,Anas platyrhynchos ,1995-08-03 ,686 ,75731.80 


1A0V 
1B3E 
1D3K 
1D4N 
1DOT 


ee 


J 


1998-03-24 
1998-03-25 
1997-04-28 
1996-12-11 
1998-12-09 
1999-09-29 
1999-10-04 
1995-08-03 
dl 


Length MW 

329 36408.40 
329 36408.40 
686 75929.00 
686 75731.80 
330 36505.50 
329 36407.40 
329 36399.40 
686 75731.80 


ha 


] 


[...] 


Sur chaque ligne, les différentes valeurs sont séparées par une virgule. La première ligne contient le nom des colonnes et 
est appelée ligne d’en-téte. 
L équivalent en TSV '* est : 


PDB 

1A8E 
1A8F 
1AIV 
1A0V 
1B3E 
1D3K 
1D4N 
1DOT 


[.. 


Sur chaque ligne, les différentes valeurs sont séparées par une tabulation. 


Attention 


ID Source 


Homo 
Homo 


Gallus gallus 


Anas 
Homo 
Homo 
Homo 
Anas 


ad 


Deposit Date 


Length MW 


sapiens 1998-03-24 329 36408.40 
sapiens 1998-03-25 329 36408.40 


platyrhynchos 


1997-04-28 686 75929.00 


1996-12-11 686 75731.80 


sapiens 1998-12-09 330 36505.50 
sapiens 1999-09-29 329 36407.40 
sapiens 1999-10-04 329 36399.40 


platyrhynchos 


1995-08-03 


686 75731.80 


17. https://python.sdv.univ-paris-diderot.fr/data-files/transferrin_report.csv 
18. https://python.sdv.univ-paris-diderot.fr/data-files/transferrin_report.tsv 
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Le caractère tabulation est un caractère invisible « élastique », c’est-à-dire qu'il a une largeur variable suivant |’ éditeur de 
texte utilisé. Par exemple, dans la ligne d’en-tête, l’espace entre PDB ID et Source apparaît comme différent de l’espace entre 
Deposit Date et Length alors qu’il y a pourtant une seule tabulation à chaque fois. 


Lecture 


En Python, le module csv de la bibliothèque standard est très pratique pour lire et écrire des fichiers au format CSV et 
TSV. Nous vous conseillons de lire la documentation très complète sur ce module !”. 
Voici un exemple : 
import csv 
with open("transferrin_report.csv") as f_in: 
f_reader = csv.DictReader(f_in) 
for row in f_reader: 
print(row["PDB ID"], row["Deposit Date"], row["Length"]) 
Ligne 1. Chargement du module csv. 
Ligne 3. Ouverture du fichier. 
Ligne 4. Utilisation du module csv pour lire le fichier CSV comme un dictionnaire (fonction DictReader ()). La ligne 
d’en-téte est utilisée automatiquement pour définir les clés du dictionnaire. 
Ligne 5. Parcours de toutes les lignes du fichiers CSV. 
Ligne 6. Affichage des champs correspondants à PDB ID, Deposit Date, Length. 
Le résultat obtenu est : 


1A8E 1998-03-24 329 
1A8F 1998-03-25 329 
1AIV 1997-04-28 686 
1A0V 1996-12-11 686 
1B3E 1998-12-09 330 
1D3K 1999-09-29 329 


Feel 
Il suffit de modifier légèrement le script précédent pour lire un fichier TSV : 


import csv 


with open("transferrin_PDB_report.tsv") as f_in: 
f_reader = csv.DictReader(f_in, delimiter="\t") 
for row in f_reader: 
print(row["PDB ID"], row["Deposit Date"], row["Length"]) 
Ligne 3. Modification du nom du fichier lu. 
Ligne 4. Utilisation de l’argument delimiter="\t" qui indique que les champs sont séparés par des tabulations. 


Le résultat obtenu est strictement identique au précédent. 


Ecriture 


Voici un exemple d’écriture de fichier CSV : 


import csv 


with open("test.csv", "w") as f_out: 
fields = ["Name", "Quantity"] 
f_writer = csv.DictWriter(f_out, fieldnames=fields) 
f_writer.writeheader () 
f_writer.writerow({"Name": "girafe", "Quantity":5}) 
f_writer.writerow({"Name": "tigre", "Quantity":3}) 
f_writer.writerow({"Name": "singe", "Quantity":8}) 


Ligne 3. Ouverture du fichier test . csv en lecture. 

Ligne 4. Définition du nom des colonnes (Name et Quantity). 

Ligne 5. Utilisation du module csv pour écrire un fichier CSV 4 partir d’un dictionnaire. 

Ligne 6. Ecriture des noms des colonnes. 

Ligne 7-9. Écriture de trois lignes. Pour chaque ligne, un dictionnaire dont les clefs sont les noms des colonnes est fourni 
comme argument à la méthode .writerow(). 

Le contenu du fichier test . csv est alors : 


19. https: //docs.python.org/fr/3.7/library/csv.html 
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Remarque 


Name ,Quantity 
girafe ,5 
tigre ,3 
singe ,8 


De façon très similaire, l’écriture d’un fichier TSV est réalisée avec le code suivant : 


import csv 


with open("test.tsv", "w") as f_out: 
fields = ["Name", "Quantity"] 
f_writer = csv.DictWriter(f_out, fieldnames=fields, delimiter="\t") 
f_writer.writeheader () 
f_writer.writerow({"Name": "girafe", "Quantity":5}) 
f_writer.writerow({"Name": "tigre", "Quantity":3}) 
f_writer.writerow({"Name": "singe", "Quantity":8}) 


Ligne 3. Modification du nom du fichier en écriture. 
Ligne 5. Utilisation de l’argument delimiter="\t" qui indique que les champs sont séparés par des tabulations. 
Le contenu du fichier test .tsv est : 


Name Quantity 
girafe 5 
tigre 3 
singe 8 


Vous étes désormais capables de lire et écrire des fichiers aux formats CSV et TSV. Les codes que nous vous avons 


proposés ne sont que des exemples. A vous de poursuivre l’exploration du module csv. 


Le module pandas décrit dans le chapitre 17 Quelques modules d’intérêt en bioinformatique est tout à fait capable de lire 


et écrire des fichiers CSV et TSV. Nous vous conseillons de l’ utiliser si vous analysez des données avec ces types de fichiers. 
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Attention 
Miniconda a été mis à jour le 29 juillet 2019, la procédure d’installation décrite ci-dessous concerne cette version. 


Python est déjà présent sous Linux ou Mac OS X et s’installe très facilement sous Windows. Toutefois, nous décrivons 
dans cet ouvrage l’utilisation de modules supplémentaires qui sont très utiles en bioinformatique (NumPy, scipy, matplotlib, 
pandas, Biopython), mais également les notebooks Jupyter. 

On va donc utiliser un gestionnaire de paquets qui va installer ces modules supplémentaires. On souhaite également que 
ce gestionnaire de paquets soit disponible pour Windows, Mac OS X et Linux. Fin 2018, il y a deux grandes alternatives : 


1. Anaconda et Miniconda : Anaconda | est une distribution complète de Python qui contient un gestionnaire de paquets 
très puissant nommé conda. Anaconda installe de très nombreux paquets et outils mais nécessite un espace disque de 
plusieurs gigaoctets. Miniconda ? est une version allégée d’ Anaconda, donc plus rapide à installer et occupant peu 
d’espace sur le disque dur. Le gestionnaire de paquet conda est aussi présent dans Miniconda. 


2. Pip : pip? est le gestionnaire de paquets de Python et qui est systématiquement présent depuis la version 3.4. 


B.1 Que recommande-t-on pour l’installation de Python ? 


Quel que soit le système d’ exploitation, nous recommandons l’utilisation de Miniconda dont la procédure d’ installation est 
détaillée ci-dessous pour Windows, Mac OS X et Linux. Le gestionnaire de paquets conda est très efficace. Il gère la version 
de Python et les paquets compatibles avec cette dernière de manière optimale. 

Par ailleurs, nous vous recommandons vivement la lecture de la rubrique sur les éditeurs de texte. Il est en effet fondamental 
d'utiliser un éditeur robuste et de savoir le configurer pour « pythonner » efficacement. 

Enfin, dans tout ce qui suit, nous partons du principe que vous installerez Miniconda en tant qu’utilisateur, et non pas 
en tant qu’administrateur. Autrement dit, vous n’aurez pas besoin de droits spéciaux pour pouvoir installer Miniconda et les 
autres modules nécessaires. La procédure proposée a été testée avec succès sous Windows (7 et 10), Mac OS C (Mac OS High 
Sierra version 10.13.6) et Linux (Ubuntu 16.04, Ubuntu 18.04). 


B.2 Installation de Python avec Miniconda 


Nous vous conseillons |’ installation de la distribution Miniconda * qui présente l’avantage d’ installer Python et un puissant 
gestionnaire de paquets appelé conda. Dans toute la suite de cette annexe, l’indication avec le $ et un espace comme suit : 


$ 


signifie l’invite d’un shell quel qu’il soit (PowerShell sous Windows, bash sous Mac OS X et Linux). 


https: //www.anaconda.com/ 
https://conda.io/miniconda.html 
https://pip.pypa.io/en/stable/ 
https://conda.io/miniconda.html 
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B.2.1 Installation de Python avec Miniconda pour Linux 


Dans un navigateur internet, ouvrez la page du site Miniconda https: //conda.io/miniconda. html puis cliquez sur le 
lien 64-bit (bash installer) correspondant a Linux et Python 3.7. Bien sur, si votre machine est en 32-bit (ce qui est maintenant 
assez rare), vous cliquerez sur le lien 32-bit (bash installer). 

Vous allez télécharger un fichier dont le nom ressemble a quelque chose du type : 

Miniconda3-latest-Linux-x86_64.sh. 

Dans un shell, lancez l’installation de Miniconda avec la commande : 

$ bash Miniconda3-latest-Linux-x86_64.sh 


Dans un premier temps, validez la lecture de la licence d'utilisation : 
Welcome to Miniconda3 4.7.10 


In order to continue the installation process, please review the license 


agreement. 
Please, press ENTER to continue 
>>> 


Comme demandé, appuyez sur la touche Entrée. Faites ensuite défiler la licence d'utilisation avec la touche Espace. Tapez 
yes puis appuyez sur la touche Entrée pour valider : 


Do you accept the license terms? [yeslno] 
[no] >>> yes 


Le programme d’ installation vous propose ensuite d'installer Miniconda dans le répertoire miniconda3 dans votre réper- 
toire personnel. Par exemple, dans le répertoire /home/pierre/miniconda3 si votre nom d’utilisateur est pierre. Validez 
cette proposition en appuyant sur la touche Entrée : 


Miniconda3 will now be installed into this location: 
/home/pierre/miniconda3 


- Press ENTER to confirm the location 
- Press CTRL-C to abort the installation 
- Or specify a different location below 


[/home/pierre/miniconda3] >>> 


Le programme d’installation va alors installer Python et le gestionnaire de paquets conda. 
Cette étape terminée, le programme d’ installation vous propose d'initialiser conda pour que celui-ci soit accessible à 
chaque fois que vous ouvrez un shell. Nous vous conseillons d'accepter en tapant yes puis en appuyant sur la touche Entrée. 


Do you wish the installer to initialize Miniconda3 
by running conda init? [yes|no] 
[no] >>> yes 


L'installation de Miniconda est terminée. L’espace utilisé par Miniconda sur votre disque dur est d’environ 450 Mo. 


Test de l’interpréteur Python 


Ouvrez un nouveau shell. A partir de maintenant, lorsque vous taperez la commande python, c’est le Python 3 de Mini- 
conda qui sera lancé : 


$ python 

Python 3.7.3 (default, Mar 27 2019, 22:11:17) 

[GCC 7.3.0] :: Anaconda, Inc. on linux 

Type "help", "copyright", "credits" or "license" for more information. 
>>> 


Quittez Python en tapant la commande exit () puis appuyant sur la touche Entrée. 


Test du gestionnaire de paquets conda 


De retour dans le shell, testez si le gestionnaire de paquets conda est fonctionnel. Tapez la commande conda dans le shell, 
vous devriez avoir la sortie suivante : 


$ conda 
usage: conda [-h] [-V] command 
conda is a tool for managing and deploying applications, environments and packages. 


Options: 
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positional arguments: 
command 
clean Remove unused packages and caches. 


Loco] 


Si c’est bien le cas, bravo, conda et bien installé et vous pouvez passez à la suite (rendez-vous à la rubrique Installation 
des modules supplémentaires) ! 


Désinstallation de Miniconda 
Si vous souhaitez supprimer Miniconda, rien de plus simple, il suffit de suivre ces deux étapes : 


1. Supprimer le répertoire de Miniconda. Par exemple pour l’utilisateur pierre : 


$ rm -rf /home/pierre/miniconda3 


2. Dans le fichier de configuration du shell Bash, supprimer les lignes comprises entre 


# >>> conda initialize >>> 


et 


# <<< conda initialize <<< 


B.2.2 Installation de Python avec Miniconda pour Mac OS X 


Dans un navigateur internet, ouvrez la page du site Miniconda https://conda.io/miniconda.html puis cliquez sur 
le lien 64-bit (bash installer) correspondant à Mac OS X et Python 3.7. Sous Mac, seule la version 64-bit est disponible. 

Vous allez télécharger un fichier dont le nom ressemble à quelque chose du type : 

Miniconda3-latest-MacOSX-x86 64.sh. 

Le système d’exploitation Mac OS X étant basé sur Unix, la suite de la procédure est en tout point identique à la procédure 
détaillée à la rubrique précédente pour Linux. 

Donc, lancez la commande : 


$ bash Miniconda3-latest -MacOSX-x86_64.sh 


puis suivez les mêmes instructions que dans la rubrique précédente (la seule petite subtilité est pour le chemin, choisissez 
/User/votre_nom_utilisateur/miniconda3 sous Mac au lieu de /home/votre_nom_utilisateur/miniconda3 sous 
Linux). 


B.2.3 Installation de Python avec Miniconda pour Windows 7 et 10 


Dans cette rubrique, nous détaillons l’installation de Miniconda sous Windows. 


Attention 

Nous partons du principe qu’aucune version d’ Anaconda, Miniconda, ou encore de Python « classique » (obtenue sur 
le site officiel de Python >) n’est installée sur votre ordinateur. Si tel est le cas, nous vous recommandons vivement de la 
désinstaller pour éviter des conflits de version. 


— Dans un navigateur internet, ouvrez la page du site Miniconda https://conda.io/miniconda.html puis cliquez 
sur le lien 64-bit (exe installer) correspondant à Windows et Python 3.7. Bien sûr, si votre machine est en 32-bit (ce 
qui est maintenant assez rare), vous cliquerez sur le lien 32-bit (exe installer). Vous allez télécharger un fichier dont le 
nom ressemble à quelque chose du type : Miniconda3-latest-Windows-x86_64.exe. 

— Une fois téléchargé, double-cliquez sur ce fichier, cela lancera l’installateur de Miniconda : 


5. https: //www.python.org/downloads/ 
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O Miniconda3 4.5.11 (64-bit) Setup = x 


D 


S Setup will gui thr the installation of Miniconda3 
miniCONDA  Merrdr= ay You through the installation o 


Welcome to Miniconda3 4.5.11 
(64-bit) Setup 


It is recommended that you dose all other applications 
before starting Setup. This will make it possible to update 
relevant system files without having to reboot your 
computer. 


Click Next to continue. 


Next > Cancel 


— Cliquez sur Next, vous arrivez alors sur l’écran suivant : 


2 Miniconda3 4.5.11 (64-bit) Setup — x 
wt License Agreement 
O ANACONDA Please review the license terms before installing Miniconda3 
4.5.11 (64-bit). 


Press Page Down to see the rest of the agreement. 


Miniconda End User License Agreement 


¡Copyright 2015, Anaconda, Inc. 
All rights reserved under the 3-dause BSD License: 


Redistribution and use in source and binary forms, with or without modification, are 
permitted provided that the following conditions are met: 
e 


If you accept the terms of the agreement, dick 1 Agree to continue. You must accept the 
agreement to install Miniconda3 4.5. 11 (64-bit). 


Anaconda, Inc, 


et Ces] | ons | 


— Lisez la licence et (si vous êtes d’accord) cliquez sur J agree. Vous aurez ensuite : 
2 Miniconda3 4.5.11 (64-bit) Setup = E x 


Select Installation Type 


O ANACONDA please select the type of installation you would like to perform for 
Miniconda3 4.5. 11 (64-bit). 


Install for: 


(8) Just Me (recommended) 


O All Users (requires admin privileges) 


Anaconda, Inc. 


<Back [| Next> | | Cancel 


— Gardez le choix de l’installation seulement pour vous (case cochée à Just me (recommended)), puis cliquez sur Next. 
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Vous aurez ensuite : 


O Miniconda3 4.5.11 (64-bit) Setup = x 


wt Choose Install Location 
E ANACONDA Choose the folder in which to install Miniconda3 4.5. 11 (64-bit). 


Setup will install Miniconda3 4.5. 11 (64-bit) in the following folder. To install in a different 
folder, click Browse and select another folder. Click Next to continue. 


Browse... 


Space required: 259, 1MB 
Space available: 168. 7GB 


<Back | Next> | | Cancel 


— P'installateur vous demande où installer Miniconda, nous vous recommandons de laisser le choix par défaut (ressem- 
blant à C:\Users\votre_nom_utilisateur\Miniconda3). Cliquez sur Next, vous arriverez sur : 


O Miniconda3 4.5.11 (64-bit) Setup = x 


ef Advanced Installation Options 
ANACONDA Customize how Anaconda integrates with Windows 


Advanced Options 


[C] Add Anaconda to my PATH environment variable 


Not recommended. Instead, open Anaconda with the Windows Start 
menu and select “Anaconda (64-bit)”. This “add to PATH” option makes 
Anaconda get found before previously installed software, but may 
cause problems requiring you to uninstall and reinstall Anaconda. 


Register Anaconda as my default Python 3.7 
This will allow other programs, such as Python Tools for Visual Studio 


PyCharm, Wing IDE, PyDev, and MSI binary packages, to automatically 
detect Anaconda as the primary Python 3.7 on the system. 


cs [Cie] | 


— Gardez la case Register Anaconda as my default Python 3.7 cochée et ne cochez pas la case Add Anaconda to my 
PATH environment variable. Cliquez ensuite sur Install, l'installation se lance et durera quelques minutes : 
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O Miniconda3 4.5.11 (64-bit) Setup = oO 


DO ANACONDA Please wait while Miniconda3 4.5. 11 (64-bit) is being installed. 


Extract: python-3.7.0-hea74fb7_0.tar.bz2 


Writing Lib/encodings/__pycache__/cp1254.cpython-37.pyc A 
Writing Lib/venv/scripts/posix/activate. fish 

Writing Lib/encodings/__pycache__/cp424.cpython-37.pyc 

Writing Lib/encodings/__pycache__/cp1258.cpython-37.pyc 

Writing tcl/tix8.4,3/STList. tcl 

Writing Lib/encodings/__pycache__/cp1257.cpython-37.pyc 

Writing Lib/lib2to3/fixes/fix_apply.py 

Writing Lib/encodings/__pycache__/mac_cyrillic.cpython-37.pyc 

Writing Lib/encodings/__pycache__/koi8_u.cpython-37.pyc 

Writing Lib/encodings/_pycache_/mac_roman.cpython-37.pyc v 


Anaconda, Inc, 


| <Back || net> Camel 


— À la fin, vous obtiendrez : 
2 Miniconda3 4.5.11 (64-bit) Setup — 


ee Installation Complete 
O ANACONDA Setup was completed successfully, 


Completed 
Removing temporary files... A 
Output folder: C:\Users\PatMiniconda3 
Creating Miniconda3 menus... 


Execute: "C:\Users Pat Miniconda3\pythonw.exe" £ -s "C:\Users\Pat\Miniconda3\Lib... 
Execute: "C:\Users Pat Winiconda3\pythonw.exe" E -s "C:\Users\Pat\Miniconda3\Lib... 
Running post install... 

Execute: "C:\Users\PatMiniconda3\pythonw.exe" £ -s “C:\Users\Pat\Miniconda3\Lib... 
Execute: “C:\Users Pat Winiconda3\pythonw.exe" E -s "C:\Users\Pat\Miniconda3\pk... 
Created uninstaller: C:\Users Pat Miniconda3\Uninstall-Miniconda3.exe 

Completed v 


Anaconda, Inc, 


Thanks for installing Miniconda3! 


Paar Anaconda is the most Python data science platform. 
miniCONDA = e 
Share your notebooks, packages, projects and environments 
on Anaconda Cloud! 


[Learn more about Anaconda Cloud 


[DD Learn how to get started with Anaconda 


ea [min] [can 


— Décochez les cases Learn more about Anaconda Cloud et Learn how to get started with Anaconda et cliquez sur 
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Finish. Miniconda est maintenant installé. 


Initialisation de conda 


Il nous faut maintenant initialiser conda. Cette manipulation va permettre de le rendre visible dans n’importe quel shell 
Powershell. 
L’installateur a en principe ajouté une nouvelle section dans le Menu Démarrer nommée Anaconda3 (64-bit) : 


' | Anaconda3 (64-bit) 
pa 


m7 Anaconda Powershell Prompt (Min... 


y Anaconda Prompt (Miniconda3) 


Cette section contient deux éléments : 
— Anaconda Powershell Prompt (Miniconda3) : pour lancer un shell Powershell (shell standard de Windows équi- 
valent du bash sous Linux) avec conda qui est activé correctement ; 
— Anaconda Prompt (Miniconda3) : méme chose mais avec le shell nommé cmd; ce vieux shell est limité et nous 
vous en déconseillons l’utilisation. 
Nous allons maintenant initialiser conda « à la main ». Cliquez sur Anaconda Powershell Prompt (Miniconda3) qui 
va lancer un Powershell avec conda activé, puis tapez lacommande conda init: 


A Anaconda Powershell Prompt (Miniconda3) 


(base) PS C:\Users\Pat> conda init, 


Lorsque vous presserez la touche Entrée vous obtiendrez une sortie de ce style : 


$ conda init 
no change 
no change 
no change 
no change 
no change 
no change 
no change 
no change 
no change 


C:\Users\Pat\Miniconda3\Scripts\conda.exe 
C:\Users\Pat\Miniconda3\Scripts\conda-env.exe 
C:\Users\Pat\Miniconda3\Scripts\conda-script.py 
C:\Users\Pat\Miniconda3\Scripts\conda-env-script.py 
C:\Users\Pat\Miniconda3\condabin\conda.bat 
C:\Users\Pat\Miniconda3\Library\bin\conda.bat 
C:\Users\Pat\Miniconda3\condabin\_conda_activate.bat 
C:\Users\Pat\Miniconda3\condabin\rename_tmp. bat 
C:\Users\Pat\Miniconda3\condabin\conda_auto_activate.bat 
no change C:\Users\Pat\Miniconda3\condabin\conda_hook. bat 

no change C:\Users\Pat\Miniconda3\Scripts\activate.bat 

no change C:\Users\Pat\Miniconda3\condabin\activate. bat 

no change C:\Users\Pat\Miniconda3\condabin\deactivate. bat 

modified C:\Users\Pat\Miniconda3\Scripts\activate 

modified C:\Users\Pat\Miniconda3\Scripts\deactivate 

modified C:\Users\Pat\Miniconda3\etc\profile.d\conda.sh 

modified C:\Users\Pat\Miniconda3\etc\fish\conf.d\conda.fish 

no change C:\Users\Pat\Miniconda3\shell\condabin\Conda.psmi 
modified C:\Users\Pat\Miniconda3\shell\condabin\conda-hook.psi 
modified C:\Users\Pat\Miniconda3\Lib\site-packages\xontrib\conda.xsh 
modified C:\Users\Pat\Miniconda3\etc\profile.d\conda.csh 

modified C:\Users\Pat\Documents\WindowsPowerShell\profile.psi 
modified HKEY_CURRENT_USER\Software\Microsoft\Command Processor\AutoRun 


==> For changes to take effect, close and re-open your current shell. <== 
Notez que cette manipulation créera automatiquement un fichier 
C:\Users\nom_utilisateur\Documents\WindowsPowerShell\profile.psi. 


Ce fichier sera exécuté à chaque lancement d’un Powershell (équivalent du . bashrc sous bash) et fera en sorte que conda 
soit bien activé. 
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Test de l’interpréteur Python 


Nous sommes maintenant prêts à tester l’interpréteur Python. En premier lieu, il faut lancer un shell PowerShell. Pour 
cela, cliquez sur le bouton Windows et tapez powershel1. Vous devriez voir apparaitre le menu suivant : 


Windows PowerShell 
Application de bureau 


Applications 
Windows PowerShell ISE 
Æ Windows PowerShell (x86) 


Windows PowerShell ISE (x86) 


Cliquez sur l’icône Windows PowerShell, cela va lancer un shell PowerShell avec un fond bleu (couleur que l’on peut 
bien sûr modifier en cliquant sur la petite icône représentant un terminal dans la barre de titre). En principe, l’invite du shell 
doit ressembler à (base) PS C:\Users\Pat>. La partie (base) indique que conda a bien été activé suite à l’initialisation 
faite si dessus (plus exactement c’est son environnement de base qui est activé, mais ça ne nous importe pas pour l’instant). 


Pour tester si Python est bien installé, il suffit alors de lancer l’interpréteur Python en tapant la commande python : 
EX Windows PowerShell = a x 


indows PowerShell 
Copyright (C) Microsoft Corporation. Tous droits réservés. 


Le chargement des profils personnels et systeme a duré 663 ms. 

(base) PS C:\Users\Pat> 

Python 3.7.3 (default, Apr 24 2019, 15:29:51) [MSC v.1915 64 bit (AMD64)] :: Anaco 
Inda, Inc. on win32 


Type "help", "copyright", "credits" or "license" for more information. 
>>> 


Si tout s’est bien passé, vous devriez avoir un affichage de ce style : 


(base) PS C:\Users\Pat> python 


Python 3.7.3 (default, Apr 24 2019, 15:29:51) [MSC v.1915 64 bit (AMD64)] :: Anaconda, Inc. on win32 


Type "help", "copyright", "credits" or "license" for more information. 
>>> 


Cela signifie que vous êtes bien dans l’interpréteur Python. A partir de lá vous pouvez taper exit () puis appuyer sur la 
touche Entrée pour sortir de l’interpréteur Python. 


Test du gestionnaire de paquets conda 


Une fois revenu dans le shell, tapez la commande conda, vous devriez obtenir : 


(base) PS C:\Users\Pat> conda 
usage: conda-script.py [-h] [-V] command 


conda is a tool for managing and deploying applications, environments and packages. 


Options: 
positional arguments: 
command 
clean Remove unused packages and caches. 
config Modify configuration values in .condarc. This is modeled 
after the git config command. Writes to the user .condarc 
file (C:\Users\Pat\.condarc) by default. 
create Create a new conda environment from a list of specified 
packages. 
help Displays a list of available conda commands and their help 
strings. 
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info Display information about current conda install. 

init Initialize conda for shell interaction. [Experimental] 

install Installs a list of packages into a specified conda 
environment. 

list List linked packages in a conda environment. 

package Low-level conda package utility. (EXPERIMENTAL) 

remove Remove a list of packages from a specified conda environment. 

uninstall Alias for conda remove. 

run Run an executable in a conda environment. [Experimental] 

search Search for packages and display associated information. The 


input is a MatchSpec, a query language for conda packages. 
See examples below. 
update Updates conda packages to the latest compatible version. 
upgrade Alias for conda update. 


optional arguments: 
-h, --help Show this help message and exit. 
-V, --version Show the conda version number and exit. 


conda commands available from other packages: 
env 


(base) PS C:\Users\Pat> 


Si c’est le cas, bravo, conda est bien installé et vous pouvez passez a la suite (rendez-vous 4 la rubrique Installation des 
modules supplémentaires) ! 


Désinstallation de Miniconda 


Si vous souhaitez désinstaller Miniconda, rien de plus simple. Dans un explorateur, dirigez-vous dans le répertoire où vous 
avez installé Miniconda (dans notre exemple il s’agit de C: \Users\votre_nom_utilisateur\Miniconda3). Attention, si 
votre Windows est installé en français, il se peut qu'il faille cliquer sur C: \ puis sur Utilisateurs plutôt que Users comme 
montré ici : 


ECE 5 Outils d'application Miniconda3 = o x 
Accueil Partage Affichage Gestion “O 
e ~ 4 T > CePC > OS(C) > Utilisateurs > Pat > Miniconda3 v Ù Rechercher dans : Miniconda3 ® 

A Nom Modifié le Type Taille la 
A Acces rapide E python.exe 28/06/2018 16:06 Application 92 Ko 
‘jm Bureau él python.pdb 28/06/2018 16:06 Fichier PDB 420 Ko 
1 Téléchargeme python3.dll 28/06/2018 16:06 Extension de l'app.. 51 Ko 
‘Is Documents & python37.dll 28/06/2018 16:05 Extension de l'app. 3753 Ko 
T= Images él python37.pdb 28/06/2018 16:05 Fichier PDB 9 684 Ko 
D PAT Ea pythonw.exe 28/06/2018 16:06 Application 90 Ko 
El pythonw.pdb 28/06/2018 16:06 Fichier PDB 420 Ko 
él atconf 25/10/2018 14:47 Fichier CONF 1 Ko 
ucrtbase.dil 29/09/2017 12:59 Extension de l'app... 978 Ko 
M] Ə Uninstall-Miniconda3.exe 25/10/2018 14:25 Application 296 Ko 
= vecorlib140.dil Description du fichier : Miniconda3 Installer Pnsion de l'app. 386 Ko 
® Ce PC veomp140.dll Entreprise : Anaconda, Inc nsion de l'app. 181 Ko 
EN y veruntime140.dll e Are nsion de l'app.. 88ko v 
74 élément(s) — 1 élément sélectionné 295 Ko Faille 7555 Ko Es 


Cliquez ensuite sur le fichier Uninstall-Miniconda3.exe. Vous aurez alors l’écran suivant : 
OD Miniconda3 4.5.11 (64-bit) Uninstall -= x 


Welcome to Miniconda3 4.5.11 
(64-bit) Uninstall 


.. Setup will guide you through the uninstallation of Miniconda3 
miniCONDA 4.5, 11 (64bit). 


Before starting the uninstallation, make sure Miniconda3 
4.5, 11 (64bit) is not running. 


Click Next to continue. 


Next > Cancel 
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Cliquez sur Next, puis à l’écran suivant cliquez sur Uninstall : 


O Miniconda3 4.5.11 (64-bit) Uninstall = x 


¿e Uninstall Miniconda3 4.5.11 (64-bit) 
O ANACONDA Remove Miniconda3 4.5. 11 (64-bit) from your computer. 


Miniconda3 4.5. 11 (64-bit) will be uninstalled from the following folder. Click Uninstall to start 
the uninstallation, 


Uninstalling from: | C:\UsersPat\Miniconda3\ 


Anaconda, Inc. 


Tossa] Coma 


Le désinstallateur se lancera alors (cela peut prendre quelques minutes) : 


O Miniconda3 4.5.11 (64-bit) Uninstall = 


P” Uninstalling 
$ ) ANACONDA Please wait while Miniconda3 4.5. 11 (64-bit) is being uninstalled. 


Delete file: C: \Users\Pat\Miniconda3\Lib \ctypes \macholib\__pycache__\dyid.cpython-37.pyc 


Delete file: C:\Users\Pat\Miniconda3\Lib\cProfile.py a 
Delete file: C:\Users\Pat\Miniconda3\Lib\crypt.py 

Delete file: C: \Users\Pat\Miniconda3\Lib\csv.py 

Delete file: C: \Users\Pat\Miniconda3\Lib \ctypes \macholib \dyld.py 

Delete file: C: \Users\Pat\Miniconda3\Lib \ctypes \macholib \dylib.py 

Delete file: C:\Users\Pat\Miniconda3\Lib \ctypes \macholib \fetch_macholib 

Delete file: C:\Users\Pat\Miniconda3\Lib \ctypes \macholib \fetch_macholib.bat 

Delete file: C: \Users\Pat\Miniconda3\Lib \ctypes \macholib \framework.py 

Delete file: C:\Users Pat Miniconda3\Lib\ctypes macholib\README.ctypes 

Delete file: C:\Users\Pat\Miniconda3\Lib\ctypes nacholib\_init_.py a 


Anaconda, Inc. 


<Back Next > Cancel 


Une fois la désinstallation terminée, cliquez sur Next : 


O Miniconda3 4.5.11 (64-bit) Uninstall = 


ser Uninstallation Complete 
Es ANACONDA Uninstall was completed successfully, 
Completed 
AAA | 
Remove folder: C: \Users\Pat\Miniconda3\Tools\scripts\__pycache__\ A 


Remove folder: C: \Users\Pat\Miniconda3\Tools\scripts\ 

Remove folder: C:\Users Pat Miniconda3\Tools\ 

Delete file: C:\Users\PatMiniconda3\ucrtbase. dll 

Delete file: C: \Users \Pat\Miniconda3\Uninstall-Miniconda3.exe 

Delete file: C:\Users\Pat\Miniconda3\vccorlib 140.dll 

Delete file: C: \Users\Pat\Miniconda3\vcomp 140. dll 

Delete file: C:\Users\Pat\Miniconda3\vcruntime 140. dll 

Remove folder: C:\Users\Pat\Miniconda3\, 

Completed v 


Anaconda, Inc, 


< Back Next > Cancel 
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Puis enfin sur Finish : 


O Miniconda3 4.5.11 (64-bit) Uninstall — 


o 


ee Miniconda3 4.5.11 (64-bit) has been uninstalled from your 
miniCONDA computer. 


Completing Miniconda3 4.5.11 
(64-bit) Uninstall 


Click Finish to dose Setup. 


Back Finish Cance 


À ce point, Miniconda est bien désinstallé. Il reste toutefois une dernière manipulation que l'installateur n’a pas effectué : 
il faut détruire à la main le fichier 


C:\Users\nom_utilisateur\Documents\WindowsPowerShell\profile.psi 


(bien sûr, remplacez nom_utilisateur par votre propre nom d'utilisateur). Si vous ne le faites pas, cela affichera un 
message d’erreur à chaque fois que vous lancerez un Powershell. 


B.3 Utilisation de conda pour installer des modules complémentaires 


B.3.1 Installation des modules supplémentaires 


Cette étape sera commune pour les trois systèmes d’exploitation. À nouveau, lancez un shell (c’est-à-dire PowerShell sous 
Windows ou un terminal pour Mac OS X ou Linux). 


Dans le shell, tapez la ligne suivante puis appuyez sur la touche Entrée : 


$ conda install numpy pandas matplotlib scipy biopython jupyterlab 


Cette commande va lancer l'installation des modules externes NumPy, pandas, matplotlib, scipy, Biopython et Jupyter lab. 
Ces modules vont être téléchargés depuis internet par conda, il faut bien sûr que votre connexion internent soit fonctionnelle. 
Au début, conda va déterminer les versions des paquets à télécharger en fonction de la version de Python ainsi que d’autres 
paramètres (cela prend une à deux minutes). Cela devrait donner la sortie suivante (copies d’écran prise sous Windows avec 
le PowerShell) : 


Æ Windows PowerShell 


(base) PS C:\Users\Pat> install numpy pandas matplotlib scipy biopython jupyterlab 
Collecting package metadata (current_repodata.json): done 
Solving environment: - m 


Une fois que les versions des paquets ont été déterminées, conda vous demande confirmation avant de démarrer le télé- 
chargement : 
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E windows PowerShell 


scipy pkgs/main/win-64::scipy-1.3.1-py37h29ff71c_0 
send2trash pkgs/main/win-64::send2trash-1.5.0-py37_0 
sip pkgs/main/win-64::sip-4.19.8-py37h6538335 © 
terminado pkgs/main/win-64::terminado-0.8.2-py37 @ 
testpath pkgs/main/win-64::testpath-0.4.2-py37 © 
tornado pkgs/main/win-64: :tornado-6.0.3-py37he774522_0 
traitlets pkgs/main/win-64: :traitlets-4.3.2-py37_0 
wcwidth pkgs/main/win-64: : 

webencodings pkgs/main/win-64: :webencodings-0.5.1-py37_1 
winpty pkgs/main/win-64: :winpty-0.4.3-4 

zeromq pkgs/main/win-64: :zeromq-4.3.1-h33f27b4_3 


The following packages will be UPDATED: 
ca-certificates 2019.5. 15-0 ==> 2019. 515-1 


certifi 2019.6.16-py37 0 ——> 2019.6:16-py37_1 
conda 4.7.10-py37_0 --> 4.7.11-py37_0 


Proceed ([y]/n)? 


Tapez y puis appuyez sur la touche Entrée pour confirmer. S’en suit alors le téléchargement et l’installation de tous les 
paquets (cela prendra quelques minutes) : 


EX Windows PowerShell = o > 


certifi 2019.6.16-py37_0 --> 2019.6.16-py37_1 
conda 4.7.10-py37_0 --> 4.7.11-py37_0 


Proceed ([y]/n)? y 


Downloading and Extracting Packages 
22 KB EHEHEHEH HEHEHEHEHE HH HEHEHEHEHE HEH HEHEH HEHEHEH H HH HER HH HH R HA HH HHHHHE 
23 KB ibid 
137 KB EHEHEHEH HHEH HHHH H HHEH HEHH HEHHE HE HEHEH HHHH H HE H H HHH H HH HHHH HHHH HHH 
55 KB FEET EEE HEE BE 
3.0 MB HEHEHEH HEH HEHEHHE HHEH HH HR R HH HARE RRHH H H HE HHHH 
678 KB FAB HHHHHHR HH HARO HHHHHHAHRHHEHERRRHHE 
pytz-2019.2 245 KB FE EEE HHHHRHHHHHHHHH 
jsons-0.8.5 25 KB FREE EEE HHH RER H H HH HH H HH HHHH HHHH HHH 
backcall-0.1.0 20 KB FEB HH HHHH HEHEHEH HEHEHHE HHHH HHH 
pandas-0.25.0 9.8 MB RARE REA EEA HEE EE 
31 KB HHHH HHHH HHH H H HH HHEH HHHH H HHHH HH HHH HHH HHHHHHHH 
12 KB ibid 
68 KB THB HEHEHEHE H HEHEHEHEHE HEHEHEHEHE HEHEHEH HEHEHEHEHE HE HEHEHEHEHE HEHEHEHE HEHEHEHEH HHHH 
381 KB 


Une fois que tout cela est terminé, vous récupérez la main dans le shell : 


EX Sélection Windows PowerShell = a x 


| FRA a 100% 
| FERRET EEE HH H H H EE 100% 
| FERRE | 100% 
| FARRAR a 100% 
| HEHEHEHEHE RER RHHHH HR HA HEHEHEH EHEHE HHHH 100% 
| FEHR aE EEE RARE 100% 
| FHHHAHHHHHHH HO HA HAHAHA HHH HO HAHAHA a 100% 
| EHHH HH HR HHEH HHRHH HEHHEHE HEHHEE HRH HEREHERE 100% 
| HEHEHEHE HEHEH HEHE HEHE HEHHEHE HEHEHEHE HEHEHEHEHE HEHEHEH HEHEHEHEHE HEHEHEHEH 100% 
| 1.1 MB FEAR a 100% 
| 145 KB FEA AREA ARRAS HR RARE RER RARE RER RER RER RER 100% 
| 


ipython-7.7.0 
nbformat-4.4.9 
zeromg-4.3.1 
Preparing transaction: done 

erifying transaction: done 

Executing transaction: \ DEBUG menuinst_win32:_ init _ (199): Menu: name: ‘Anaconda${PY VER} ${PL 
ATFORM}', prefix: ‘C:\Users\Pat\Miniconda3', env_name: ‘None’, mode: ‘user’, used mode: ‘user 
DEBUG menuinst_win32:create(323): Shortcut cmd is C:\Users\Pat\Miniconda3\python.exe, args are [ 
"c:\\Users\\Pat\\Miniconda3\\cwp.py', 'C:\\Users\\Pat\\Miniconda3', 'C:\\Users\\Pat\\Miniconda3\ 
\python.exe', ‘C:\\Users\\Pat\\Miniconda3\\Scripts\\jupyter-notebook-script.py', '"%USERPROFILE% 
eal 

done 

(base) PS C:\Users\Pat> 


19.6 MB FERRET EERE EEE EEE AEE HHHH HHRHH HHEHHHHHHHHH 100% 


B.3.2 Test des modules supplémentaires 


Pour tester la bonne installation des modules, lancez l’interpréteur Python : 


$ python 


Puis tapez les lignes suivantes : 


import numpy 
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import scipy 
import Bio 

import matplotlib 
import pandas 


Vous devriez obtenir la sortie suivante (ici sous Windows) : 


EX Windows PowerShell = o x 


(base) PS C:\Users\Pat> 
Python 3.7.3 (default, Apr 24 2019, 15:29:51) [MSC v.1915 64 bit (AMD64)] :: Anaconda, 
. on win32 
"help", "copyright", "credits" or "license" for more information. 
import numpy 
import scipy 


import Bio 
import matplotlib 
import pandas 


Si aucune erreur ne s’affiche et que vous récupérez la main dans l’interpréteur, bravo, ces modules sont bien installés. 
Quittez l’interpréteur Python en tapant la commande exit () puis en appuyant sur la touche Entrée. 
Vous êtes de nouveau dans le shell. Nous allons maintenant pouvoir tester Jupyter. Tapez dans le shell : 


$ jupyter lab 


ca localhost ae ne © fy |Q chen noD 


Pour quitter Jupyter, allez dans le menu File puis sélectionnez Quit. Vous pourrez alors fermer l’ onglet de Jupyter. Pendant 
ces manipulations dans le navigateur, de nombreuses lignes ont été affichées dans l’interpréteur : 


(base) PS C:\Users\Pat> jupyter lab 


[I 18:26:05.544 LabApp] JupyterLab extension loaded from C:\Users\Pat\Miniconda3\lib\site-packages\jupyterl: 


[I 18:26:05.544 LabApp] JupyterLab application directory is C:\Users\Pat\Miniconda3\share\jupyter\lab 


[sca] 

[I 18:27:20.645 LabApp] Interrupted... 

[I 18:27:32.986 LabApp] Shutting down 0 kernels 
(base) PS C:\Users\Pat> 


Il s’agit d’un comportement normal. Quand Jupyter est actif, vous n’avez plus la main dans l’interpréteur et tous ces 
messages s’affichent. Une fois que vous quittez Jupyter, vous devriez récupérer la main dans l’interpréteur. Si ce n’est pas le 
cas, pressez deux fois la combinaison de touches Ctrl + C 

Si tous ces tests ont bien fonctionné, bravo, vous avez installé correctement Python avec Miniconda ainsi que tous les 
modules qui seront utilisés pour ce cours. Vous pouvez quitter le shell en tapant exit puis en appuyant sur la touche Entrée 
et aller faire une pause! 


B.3.3 Un mot sur pip pour installer des modules complémentaires 


Conseil : Pour les débutants, vous pouvez sauter cette rubrique. 

Comme indiqué au début de ce chapitre, pip * est un gestionnaire de paquets pour Python et permet d’ installer des modules 
externes. Pip est également présent dans Miniconda, donc utilisable et parfaitement fonctionnel. Vous pouvez vous poser la 
question « Pourquoi utiliser le gestionnaire de paquets pip si le gestionnaire de paquets conda est déjà présent ? ». La réponse 
est simple, certains modules ne sont présents que sur les dépôts pip. Si vous souhaitez les installer il faudra impérativement 
utiliser pip. Inversement, certains modules ne sont présent que dans les dépôts de conda. Toutefois, pour les modules classiques 
(comme NumPy, scipy, etc), tout est gérable avec conda. 


6. https://pip.pypa.io/en/stable/ 
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Sauf cas exceptionnel, nous vous conseillons l’utilisation de conda pour gérer l’installation de modules supplémen- 
taires. 

Si vous souhaitez installer un paquet qui n’est pas présent sur un dépôt conda avec pip, assurez vous d’abord que votre 
environnement conda est bien activé (avec conda activate ou conda activate nom_ environnement). La syntaxe est 
ensuite très simple : 


$ pip install nom_du_paquet 


Si votre environnement conda était bien activé lors de l’appel de cette commande, celle-ci aura installé votre paquet dans 
l’environnement conda. Tout est donc bien encapsulé dans l’environnement conda, et l’ ajout de tous ces paquets ne risque pas 
d'interférer avec le Python du système d’exploitation, rendant ainsi les choses bien « propres ». 


B.4 Choisir un bon éditeur de texte 


La programmation nécessite d’écrire des lignes de code en utilisant un éditeur de texte. Le choix de cet éditeur est donc 
fondamental, celui-ci doit nous aider à repérer rapidement certaines zones du programme afin d’être efficace. Outre les fonc- 
tions de manipulation / remplacement / recherche de texte, un bon éditeur doit absolument posséder la coloration syntaxique 
(syntax highlighting en anglais). Celle-ci change la couleur et / ou la police de certaines zones du code comme les mot-clés du 
langage, les zones entre guillemets, les commentaires, etc. Dans ce qui suit, nous vous montrons des éditeurs faciles à prendre 
en main par les débutants pour Linux, Windows et Mac OS X. 


B.4.1 Installation et réglage de gedit sous Linux 


Pour Linux, on vous recommande l’utilisation de l’éditeur de texte gedit qui a les avantages d’être simple à utiliser et 
présent dans la plupart des distributions Linux. 
Si gedit n’est pas installé, vous pouvez l'installer avec la commande : 


$ sudo apt install -y gedit 
Il faudra entrer votre mot de passe utilisateur puis valider en appuyant sur la touche Entrée. 


Pour lancer cet éditeur, tapez la commande gedit dans un shell ou cherchez gedit dans le lanceur d’applications. Vous 
devriez obtenir une fenêtre similaire à celle-ci : 


Ouvrir Y A Document 1 sans titre Enregistrer = 


Texte brut ~ Largeur des tabulations : 4 v Lig 1, Col 1 = INS 


On configure ensuite gedit pour que |’ appui sur la touche Tab corresponde à une indentation de 4 espaces, comme recom- 
mandée par la PEP 8 (chapitre 15 Bonnes pratiques en programmation Python). Pour cela, cliquez sur l’icône en forme de 3 
petites barres horizontales en haut à droite de la fenêtre de gedit, puis sélectionnez Préférences. Dans la nouvelle fenêtre qui 
s’ouvre, sélectionnez l’onglet Éditeur puis fixez la largeur des tabulations à 4 et cochez la case Insérer des espaces au lieu des 
tabulations : 
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Préférences 


Affichage Éditeur 
Tabulations 
Largeur des tabulations : | 4 = 4s 


Activer l'indentation automatique 


Enregistrement des fichiers 


Texte brut y Largeur des tabulations : 4 + 


Police et couleurs 


Insérer des espaces au lieu de tabulations 


Enregistrer automatiquement toutes les | 10 = 


Greffons 


Créer une copie de sauvegarde des fichiers avant l'enregistrement 


+ | minutes 


Lig 1, Col 1 y INS 


Si vous le souhaitez, vous pouvez également cochez la case Activer l’indentation automatique qui indentera automati- 
quement votre code quand vous êtes dans un bloc d’instructions. Fermez la fenêtre de paramètres une fois la configuration 


terminée. 


B.4.2 Installation et réglage de Notepad++ sous Windows 


Sous Windows, nous vous recommandons l’excellent éditeur Notepad++’. Une fois cet éditeur installé, il est important 
de le régler correctement. En suivant le menu Paramètres, Préférences, vous arriverez sur un panneau vous permettant de 


configurer Notepad++. 


En premier on va configurer l’appui sur la touche Tab afin qu’il corresponde à une indentation de 4 espaces, comme 
recommandé par la PEP 8 (chapitre 15 Bonnes pratiques en programmation Python). Dans la liste sur la gauche, cliquez sur 
Langage, puis à droite dans le carré Tabulations cochez la case Insérer des espaces en réglant sur 4 espaces comme 


indiqué ci-dessous : 


[Préférences 


Général Menu Langage 
Zones d'édition 7] Compacter le menu Langage 
Nouveau document 
Dossier par défaut f Langages disponibles Langages cachés 
Historique des fichiers ré 
Extensions de fichier Normal Text A Python 
ECTS PHP 
| (Coloration Ic 
Impression [C++ 
Sauvegarde CH => 
Autocomplétion Objective-C 
Instance Multiple Java 
| Délimiteur Resource file 
Cloud HTML <- 
Moteur de recherche XML 
Divers Makefile 


Pascal 

Batch 

INI file 

MS-DOS Style D 


Fermer 


Tabulations 


[Default] A 

normal 

actionscript 

ada 

asm 

asni 

asp 

autoit 

avs 

baanc 

bash 

batch v 
Taille : 4 


1] Insérer des espaces 


Ensuite, il est important de faire en sorte que Notepad++ affiche les numéros de ligne sur la gauche (très pratique lorsque 
l’interpréteur nous indique qu'il y a une erreur, par exemple, à la ligne 47). Toujours dans la fenêtre Préférences, dans 
la liste sur la gauche cliquez sur Zones d'édition, puis sur la droite cochez la case Afficher la numérotation des 


lignes comme indiqué ici : 


7. https://notepad-plus-plus.org/download 
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Préférences a 
Général Curseur Multiédition 
Clignotement : : ae 
Nouveau document Largeur : 1 #7 ie z Activer (Ctrl+Clic/sélection) 
Dossier par défaut y A en 


Historique des fichiers ré 


Extensions de fichier Contrôle de repli de bloc Largeur des lignes Ligne pliée 

Langage 

nen O Simple Afficher la marge droite O Défaut 

e O Flèche Afficher un filet vertical (O Aligné 

Autocomplétion O Cerde Colorer l'arrière-plan O Indenté 

Instance Multiple 

Délimiteur © Carré 

Cloud | Afficher la numérotation des lignes 
Aucun 

Dies Sou O Largeur de la bordure | Afficher la marge de signet 


I 2 Pas de bordure [M Surligner la ligne actuelle 
Activer le lissage de police 


Activer le défilement au-delà de la derniè 


Désactiver le défilement avancé 
(en cas de problème du touchpad) 


Fermer 


B.4.3 Installation et réglage de Text Wrangler/BBedit sous Mac OS X 


Sur les anciennes versions de Mac OS X (< 10.14), TextWrangler è était un éditeur de texte simple, intuitif et efficace. 
Toutefois son développement a été arrêté car il fonctionnait en 32-bits. Il a été remplacé par BBedit” qui possède de nom- 
breuses fonctionnalités supplémentaires mais qui doit en principe être acheté. Toutefois, ce dernier est utilisable gratuitement 
avec les mêmes fonctionnalités que TextWrangler, sans les nouvelles fonctionnalités étendues. Ne possédant pas de Mac, nous 
nous contentons ici de vous donner quelques liens utiles : 

— La page de téléchargement |° ; 

— La page vers de nombreuses ressources !! utiles; 

— Le manuel d'utilisation !? (avec toutes les instructions pour son installation au chapitre 2); 

— Une page sur Stackoverflow !* qui vous montre comment faire en sorte que |’ appui sur la touche Tab affiche 4 espaces 

plutôt qu’une tabulation. 


B.4.4 Pour aller plus loin 


Jusque là, nous vous avons montré des éditeurs de texte simples qui sont, selon nous, idéaux pour apprendre un langage 
de programmation. Ainsi, on se concentre sur le langage Python plutôt que toutes les options de l’éditeur. Toutefois, pour les 
utilisateurs plus avancés, nous vous conseillons des éditeurs plus puissants comme par exemple Sublime Text '* ou Atom |. 
Pour aller encore plus loin, il existe aussi des plateformes de développement !° ou IDE (integrated development environment) 
qui, au-delà de l’édition, permettent par exemple d'exécuter le code et de le debugger (c’est-à-dire, y chasser les erreurs). On 
peut citer par exemple les IDE libres Visual Studio code !? et Spyder '*, mais il en existe de nombreux autres qui sont souvent 


payants. 


B.5 Comment se mettre dans le bon répertoire dans le shell 


Pour apprendre Python, nous allons devoir écrire des scripts, les enregistrer dans un répertoire, puis les exécuter avec 
l’interpréteur Python. Il faut pour cela être capable d’ouvrir un shell et de se mettre dans le répertoire où se trouve ce script. 

Notre livre n’est pas un cours d'Unix mais il convient au moins de savoir se déplacer dans l’arborescence avant de lancer 
Python. Sous Linux et sous Mac il est donc fondamental de connaitre les commandes Unix cd, pwd, 1s et la signification de 
.. (point point). 


8. http://www.barebones.com/products/texturangler/ 
9. https://www.barebones.com/products/bbedit/ 
10. http://www.barebones.com/products/bbedit/download.html 
11. https://www.barebones.com/support/bbedit/ 
12. https://s3.amazonaws.com/BBSW-download/BBEdit_12.6.6_User_Manual.pdf 
13. https://stackoverflow.com/questions/5750361/auto-convert-tab-to-4-spaces-in-textwrangler 
14. https://www.sublimetext.com/ 
15. https://atom.io/ 
16. https://fr.wikipedia. org/wiki/Environnement _de_d/,C3/A9veloppement 
17. https://code.visualstudio.com/ 
18. https://www.spyder-ide.org/ 
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Sous Windows, il existe deux astuces très pratiques. Lorsqu'on utilise l’explorateur Windows et que l’on est dans un 
répertoire donné : 


D| M E = | Python - x 
Accueil Partage Affichage 7v e 
e v 4’ | > CePC > user data (D:) > PAT > Python v À Rechercher dans : Python yo) 
in Bureau + 8 Nom ^ Modifié le Type Taille 
W Téléchargeme # El test.py 14/11/2018 19:33 Fichier PY 1 Ko 


‘Documents + 


E Images A 


Il est possible d’ouvrir un PowerShell directement dans ce répertoire : 


Première astuce 


Il suffit de taper powershe11 dans la barre qui indique le chemin : 


LM E = | Python = 


Accueil Partage Affichage 


€ vs | powershell v |=> Rechercher dans : Python 
1 | powershell | 
new_version -P Rechercher « powershell » Type Taille 
T tmp A error Fichier PY 1Ko 
M Ce PC 
= Bureau 


puis on appuie sur entrée et le PowerShell se lance en étant directement dans le bon répertoire ! 


Deuxième astuce 


En pressant la touche shift et en faisant un clic droit dans un endroit de l’explorateur qui ne contient pas de fichier (attention, 
ne pas faire de clic droit sur un fichier !). Vous verrez alors s’afficher le menu contextuel suivant : 
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€ v 4% T > CePC > user_data (D:) > PAT > Python 


AN 


so C] Nom 
Ar Accès rapide 


m Bureau + ay test.py 


Affichage ? 


DA 


Trier par 
Regrouper par > 


Actualiser 
Personnaliser ce dossier... 


Coller 
Coller le raccourci 


Annuler Copier Ctrl+Z 


Ouvrir la fenétre PowerShell ici 


<) Open with Code 


Ouvrir l'interpréteur de commandes Linux ici 
Accorder l'accès à > 
Nouveau > 


Propriétés 


S A 


1 élément 


Cliquez sur Ouvrir la fenêtre PowerShell ici, à nouveau votre Powershell sera directement dans le bon répertoire ! 
Vérification 


La figure suivante montre le PowerShell, ouvert de la première ou la deuxième façon, dans lequel nous avons lancé la 
commande 1s qui affiche le nom du répertoire courant (celui dans lequel on se trouve, dans notre exemple D: \PAT\Python) 
ainsi que les fichiers s’y trouvant (ici il n’y a qu’un fichier : test . py). Ensuite nous avons lancé l’exécution de ce fichier 
test.py en tapant python test.py. 
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EX Windows PowerShell = o 
indows PowerShel | l ; ; 
Copyright (C) Microsoft Corporation. Tous droits réservés. 


PS D:\PAT\Python> Is 
Répertoire : D:\PAT\Python 


LastwriteTime Length Name 


14/11/2018 19:33 249 test.py 


PS D:\PAT\Python> on test.py 
C'est fini ! 


A votre tour! 

Pour tester si vous avez bien compris, ouvrez votre éditeur favori, tapez les lignes suivantes puis enregistrez ce fichier avec 
le nom test. py dans le répertoire de votre choix. 

import tkinter as tk 

racine = tk.Tk() 

label = tk.Label(racine, text="J'adore Python !") 

bouton = tk.Button(racine, text="Quitter", command=racine. quit) 

bouton["fg"] = "red" 

label. pack () 

bouton. pack () 

racine.mainloop() 

print ("C'est fini !") 

Comme nous vous l’avons montré ci-dessus, ouvrez un shell et déplacez-vous dans le répertoire où se trouve test.py. 
Lancez le script avec l’interpréteur Python : 


$ python test.py 


Si vous avez fait les choses correctement, cela devrait afficher une petite fenêtre avec un message « J’adore Python! » et 
un bouton Quitter. 


B.6 Python web et mobile 


Si vous ne pouvez ou ne souhaitez pas installer Python sur votre ordinateur (quel dommage !), des solutions alternatives 
s'offrent à vous. 

Des sites internet vous proposent l’équivalent d’un interpréteur Python utilisable depuis votre navigateur web : 

— replit!”; 

— Tutorials Poin 

— et bien sur l'incontournable Python Tutor ?!. 

Des applications mobiles vous permettent aussi de « pythonner » avec votre smartphone : 

— Pydroid 3 ?? pour Android; 

— Pythonista 32% pour iOS (payant). 

Soyez néanmoins conscient que ces applications web ou mobiles peuvent étre limitées, notamment sur leur capacité a 
installer des modules supplémentaires et a gérer les fichiers. 


(20; 


19. https: //rep1.it/languages/python3 

20. https: //www.tutorialspoint.com/execute_python3_online.php 

21. http://pythontutor.com/visualize.html#mode=edit 

22. https: //play.google.com/store/apps/details?id=ru.iiec.pydroid3 
23. https://itunes.apple.com/us/app/pythonista-3/id1085978097 
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